Semana 45 - Snowpark & Python

¡Esta semana estamos creando UDF permanentes a través de Snowpark y dándoles un toque!

Ejecuta esto en la consola de SnowflakeCREATE OR REPLACE TABLE website_clicks (    id INTEGER,    user_id INTEGER,    page_url STRING,    click_time TIMESTAMP,    click_location STRING);INSERT INTO website_clicks VALUES (1, 101, 'https://www.example.com/home', '2023-05-12 08:00:00', '<div id="header" class="header">');INSERT INTO website_clicks VALUES (2, 102, 'https://www.example.com/products', '2023-05-12 08:05:00', '<main class="content">');INSERT INTO website_clicks VALUES (3, 101, 'https://www.example.com/about', '2023-05-12 08:10:00', '<footer class="site-footer">');INSERT INTO website_clicks VALUES (4, 103, 'https://www.example.com/home', '2023-05-12 08:15:00', '<section class="main-content">');INSERT INTO website_clicks VALUES (5, 102, 'https://www.example.com/contact', '2023-05-12 08:20:00', '<header class="site-header">');

  1. Descargar este archivo
  2. Coloque ese archivo en una etapa interna
  3. Cree una UDF desde esa etapa llamada exctract_class_value
  4. Ejecute el siguiente código y verifique que lo haya hecho correctamente 

clean_data = (

session.table("website_clicks") 

.withColumn(  

"click_location", 

call_udf("extract_class_value", col("click_location"))

)

)

PD ¡Hablaré sobre todo lo relacionado con Snowpark en un panel de discusión en Summit!

Imagen que contiene TextoDescripción generada automáticamente

Recuerda que si deseas participar:

  1. Regístrate como miembro de Frosty Friday. Puedes hacerlo haciendo clic en la barra lateral y luego yendo a "REGISTRARSE" (ten en cuenta que unirte a nuestra lista de correo no te proporcionará una cuenta de Frosty Friday).
  2. Publica tu código en GitHub y asegúrate de que sea de acceso público (consulta nuestra guía si no sabes cómo hacerlo).
  3. Publica la URL en los comentarios del desafío.

Si tienes alguna pregunta técnica que te gustaría plantear a la comunidad, puedes hacerlo aquí, en nuestro hilo dedicado a estos retos.

Previous
Previous

Semana 46 - SQL y Técnicas de Consulta

Next
Next

Semana 45 – Avanzado