Trino を触ってみた

この記事は 気にはなってるけど触ってないビッグデータ系のツール・サービスを触る Advent Calendar 2022 にリンクしてます。 はじめに アドベントカレンダー用にいくつか調べてみたい候補として DataSketch や Iceberg などがありましたが、Trino というツールが気になったのでこちらをさわってみようかと思います。 Trino とは? もともとは Presto を開発したメンバー 2018 年頃に Facebook から離れて別プロジェクトして開発を始め、 2020 年にリブランドしたプロジェクトのようです。リブランドの背景はこちらのブログをください (参考)。 会社によってコミュニティへの関わり方や考え方が違うということは私も経験してきましたが、このブログからも Trino 開発メンバーから見た会社とコミュニティへの考え方の現状は把握できるかと思います。もちろん Trino 開発メンバーからの視点だけなので実際の現情はわかりませんので知っている方いたら教えてください。 詳細な概要はこちらの記事のほうがまとまっているのでそちらをご覧ください 高性能分散SQLエンジン「Trino」最速ガイド。 Hiveより速いは触ったことがないのでわからないですがそこは気になりますね。 この記事では、 docker で Trino を触ってみた話を書いてみたいと思います。 2022/12/24時点 watch folk star 162 2.1 k 6.9 k Docker ではじめる Trino まずは Docker の起動と SQL cli の実行です。 docker run --name trino -d -p 8080:8080 trinodb/trino #2回目の実行は下記 docker run -d -p 8080:8080 trinodb/trino docker exec -it trino trino このまま docker exec で実行していくとデータをいれるのが手間がかかりそうなので docker-compoase を使いたいと思います。その前にデータストアについて考えます。...

December 25, 2022 · 2 min · Implicit none