Semana 45 - Snowpark & Python
¡Esta semana estamos creando UDF permanentes a través de Snowpark y dándoles un toque!
Ejecuta esto en la consola de SnowflakeCREATE OR REPLACE TABLE website_clicks ( id INTEGER, user_id INTEGER, page_url STRING, click_time TIMESTAMP, click_location STRING);INSERT INTO website_clicks VALUES (1, 101, 'https://www.example.com/home', '2023-05-12 08:00:00', '<div id="header" class="header">');INSERT INTO website_clicks VALUES (2, 102, 'https://www.example.com/products', '2023-05-12 08:05:00', '<main class="content">');INSERT INTO website_clicks VALUES (3, 101, 'https://www.example.com/about', '2023-05-12 08:10:00', '<footer class="site-footer">');INSERT INTO website_clicks VALUES (4, 103, 'https://www.example.com/home', '2023-05-12 08:15:00', '<section class="main-content">');INSERT INTO website_clicks VALUES (5, 102, 'https://www.example.com/contact', '2023-05-12 08:20:00', '<header class="site-header">');
- Descargar este archivo
- Coloque ese archivo en una etapa interna
- Cree una UDF desde esa etapa llamada exctract_class_value
- Ejecute el siguiente código y verifique que lo haya hecho correctamente
clean_data = (
session.table("website_clicks")
.withColumn(
"click_location",
call_udf("extract_class_value", col("click_location"))
)
)
PD ¡Hablaré sobre todo lo relacionado con Snowpark en un panel de discusión en Summit!
Recuerda que si deseas participar:
- Regístrate como miembro de Frosty Friday. Puedes hacerlo haciendo clic en la barra lateral y luego yendo a "REGISTRARSE" (ten en cuenta que unirte a nuestra lista de correo no te proporcionará una cuenta de Frosty Friday).
- Publica tu código en GitHub y asegúrate de que sea de acceso público (consulta nuestra guía si no sabes cómo hacerlo).
- Publica la URL en los comentarios del desafío.
Si tienes alguna pregunta técnica que te gustaría plantear a la comunidad, puedes hacerlo aquí, en nuestro hilo dedicado a estos retos.