Semaine 45 - Snowpark & Python
Cette semaine, nous créons des UDF (User-Defined Functions) via Snowpark !
Voici vos données de démarrage :
CREATE OR REPLACE TABLE website_clicks (id INTEGER,user_id INTEGER,page_url STRING,click_time TIMESTAMP,click_location STRING);INSERT INTO website_clicks VALUES (1, 101, 'https://www.example.com/home', '2023-05-12 08:00:00', '<div id="header" class="header">');INSERT INTO website_clicks VALUES (2, 102, 'https://www.example.com/products', '2023-05-12 08:05:00', '<main class="content">');INSERT INTO website_clicks VALUES (3, 101, 'https://www.example.com/about', '2023-05-12 08:10:00', '<footer class="site-footer">');INSERT INTO website_clicks VALUES (4, 103, 'https://www.example.com/home', '2023-05-12 08:15:00', '<section class="main-content">');INSERT INTO website_clicks VALUES (5, 102, 'https://www.example.com/contact', '2023-05-12 08:20:00', '<header class="site-header">');
- Download ce fichier
- Placez ce fichier dans un stage interne.
- Créez une UDF à partir de ce stage appelée "exctract_class_value".
- Exécutez le code ci-dessous et vérifiez que vous l'avez fait correctement.
clean_data = (session.table("website_clicks").withColumn("click_location",call_udf("extract_class_value", col("click_location"))))