Claude Code + AWS 関連MCP で調査を円滑にする
Claude Code + MCP で自然言語で調査指示できる様になった話です。
Claude Code + MCP で自然言語で調査指示できる様になった話です。
AWS Glue Iceberg テーブルは 2025.10.28 時点で format-version=2 までサポートしていますが、format-version=3 はサポートしていません。
とはいえ、Iceberg format-version=3 としてデータを保存し利用はできます。
Athena でクエリ実行できない等の問題こそありますが、format-version=3 として利用はでき、テーブル v3 スペックの恩恵 を受けることができます。
AWS Glue テーブルを Iceberg v3 format で管理し、 Databricks 等の SaaS でデータを参照するような運用をしている場合には大きなパフォーマンスの向上が見込めます。
ですが、 AWS Glue テーブルの最適化機能は format-version=3 の場合、エラーとなります。
その為、Glue Job で Spark SQL 等でテーブル最適化を実施する必要があります。
以下実施例です。
iceberg テーブルの圧縮形式は snappy や gzip 等が選択できますが、
zstd が圧縮・伸縮効率がよくコストパフォーマンスに優れています。
ですが、
圧縮形式 zstd の parquet は s3 select 未サポート (2024.10.05 時点) なので、
parquet を解析したい場合、macOS ローカルにダウンロードし、解析するなりが必要です。
現時点 2025.10.03 では、 Iceberg format-versoin=3 では、 Athena からクエリ実行することもできません。
parquet-cli を利用しデータの内容を確認する必要があったので備忘録として残します。
1 | brew install parquet-cli |
AWS RDS の CDC を Kafka でストリーミングし Iceberg テーブルへ配信し分析基盤を構築しました。
その際に RDS のメトリクスから Kafka への流入量を試算するスクリプトを作成しましたので公開します。
SaaS への見積もりで流入量が必要だったので、スクリプトで試算した数値と合わせてスクリプトも提出した所、概ね問題ないことを確認いただけました。
AWS で複数のアカウントを管理している際、プロファイルの切り替えが面倒になることがあります。
今回は awsume と peco を組み合わせたインタラクティブな AWS プロファイル選択スクリプトを紹介します。
Confluent Cloud の料金体系について、SaaS版と AWS Marketplace版の比較を調べてみました。
※ 本記事は Claude Code で調べ得た内容を Obsidian にまとめさせブログ化してもらいました。初の試み💓
Python の構文チェックツールが乱立しており、それぞれ用途が異なり、設定が大変だったところを tox というツールでまとめてみました。
AWS ECS コンテナロギングをデータ分析観点からどの様な構成だと分析に都合が良いかの観点を記載します。
基本ログは追加のみで更新や削除はされない性質があるので、その点を考慮して登録されることを意識したアーキテクチャが望ましいです。
デフォルトではこのような構成がよく見受けられます。
備忘録として
Datadog の子組織の削除方法をまとめます。
サポートの状況次第ですが、おおよそ 1週間程度で削除していただけました。
以上です。
RDS のテーブルデータを分析用テーブルにレプリケートする方法が多数あったのでその一覧をまとめます。
RDS をユーザ影響を極力低くすべく、分析用テーブルへレプリケートして、分析する方法が多々あったので私見ですが Pros/Cons をまとめます。