BigQuery Intro
Bigquery
Google Cloud Platform 에서 제공해주는 Data Warehouse service중 하나이면서 , Big data analytics tool입니다. Big data analytics를 위해 쓸모있는 structured data , semi-structured data가 Bigquery로 loading 됩니다.
query petabyte in seconds
Bigquery는 petabyte 단위의 데이터를 초단의 latency로 query할 수 있습니다.
Ecosystem
ETL and Data processing
다양한 Sass(Software as a service)로 부터 data를 Bigquery로 loading하거나 federated query를 할 수 있습니다.
AmazonS3
Youtube
Cloud Storage
on-premise ..etc
visualization and analytics tools
단순히 , 플랫폼을 넘어서 다른 GCP 서비스 및 coworker에서 dashboard를 볼 수 있습니다.
- Google Spread Sheet
- DataStudio 360
- G-Suite
- Datalab
- co-workes..etc
serverless and no-ops
Serverless라함은 GCP에서는 instance를 작업하는 동안 생성하고 , 작업이 끝나면 자동으로 turn off하는 과정을 user가 할 필요가 없는것 이라고 생각합니다.(표현에 틀린 부분이 있으면 지적해주세요.)
그저 Query 문을 작성하고 실행하면 됩니다.
ad-hoc queries.
Ad-hoc query는 not-predetrmined query입니다. 실행하기 전까지 query의 결과값이 결정되지 않는 쿼리입니다.
자세히는 알지 못해서 이 이상의 설명은 어려울 거 같습니다.
Machine Learning
Bigquery는 Bigquery ML을 제공합니다. SQL 쿼리 문법으로 ML model을 만들 수 있게 해줍니다.
Leave a comment