Semana 67 - Procedimientos Almacenados y UDFs
Esta semana, avanzamos con nuestro desafío anterior de la Semana 65 y mostramos nuestra preferencia por los datos semiestructurados y generaremos nuestro propio Objeto.
Esta semana, nos sumergiremos nuevamente en el conjunto de datos “Cybersyn US Patent Grants” del Market Place y utilizaremos nuestras propias funciones para interactuar con él.
El aspecto fascinante de los datos semiestructurados y los tipos de columnas VARIANT en Snowflake es que ofrecen una forma flexible de manejar diversos formatos de datos. Actúan como un repositorio dinámico, lo que le permite almacenar y analizar información multifacética sin estar restringido a un esquema rígido. Además, combinarlos con la capacidad de Snowflake para almacenar y recuperar objetos brinda a todo el equipo un modelo de datos escalable. Y aquí hay una ventaja: puede aprovechar estas funciones en conjuntos de datos públicos, como el de Cybersyn.
Entonces, aquí está el plan de juego:
- Obtenga el conjunto de datos Cybersyn US Patent Grants del mercado.
- Utilice la consulta SQL de Cybersyn para buscar todas las patentes relacionadas con Nvidia (hemos puesto un límite de 10 para no abrumarlo con los resultados).
SELECT patent_index.patent_id, invention_title, patent_type, application_date, document_publication_dateFROM cybersyn_us_patent_grants.cybersyn.uspto_contributor_index AS contributor_indexINNER JOINcybersyn_us_patent_grants.cybersyn.uspto_patent_contributor_relationships AS relationshipsON contributor_index.contributor_id = relationships.contributor_idINNER JOINcybersyn_us_patent_grants.cybersyn.uspto_patent_index AS patent_indexON relationships.patent_id = patent_index.patent_idWHERE contributor_index.contributor_name ILIKE 'NVIDIA CORPORATION'AND relationships.contribution_type = 'Assignee - United States Company Or Corporation'LIMIT 10
- Cree una función que cree un objeto en una columna VARIANT, comparable a la captura de pantalla que se muestra a continuación. La función de la semana 65 no ha cambiado mucho: Calcular el intervalo entre
APPLICATION_DATEyPUBLICATION_DATEpuede ser de 365 días para las patentes de “reedición” y de 2 años para las de “diseño”. Tener una designación de verdadero o falso si estamos DENTRO del conjunto de parámetros para cualquiera de las patentes
- Como último objetivo; Obtenga los valores inside_of_projection en una columna diferente (lo que significa que queremos que los saque del objeto)
