takegue / estante

0 stars 0 forks source link

Analytics Hubからbqfunデータセットを利用する: 法人情報および祝日情報データセットの利用 #30

Open takegue opened 2 years ago

takegue commented 2 years ago

概要

https://t.co/2BsGOQlnp4

bqfunのデータセットを利用する

データセットを使ってみる

追加の手順を進めることで、プロジェクト内にアクセス可能なデータセットができる:

祝日 データセット
SELECT * 
FROM `jp_holidays_preprocessed_by_bq_fun.holidays` 
where extract(year from date) between 2016 and 2022
order by date 
法人 データセット
# 特許の分布と、特許数の多い企業名について調べる
with base as (
  SELECT 
    corporate_number, count(1) as n_patent
  FROM `project-id-7288898082930342315.gbizinfo_preprocessed_by_bq_fun.patent` 
  group by corporate_number
)
, stats as (
  select 
    approx_quantiles(n_patent, 20) as q20tiles
    , approx_top_sum(corporate_number, n_patent, 10) as top10
  from base
)
, report as (
  SELECT 
    *
    , array(
      select as struct
        kv.value, name, kv.sum
      from unnest(stats.top10) kv
      left join `project-id-7288898082930342315.gbizinfo_preprocessed_by_bq_fun.basic`
        on value = corporate_number
      order by kv.sum desc
    )
  from stats
)

select * from report

image

Analytics Hubを使っていて気になったところ

今回、Analytics Hubをはじめてつかったところで気になったところについて書いておく