ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
CData JDBC Driver for HDFS はダッシュボードや帳票ツールからリアルタイムHDFS データへの連携を可能にします。この記事では、HDFS をJDBC データソースとして接続する方法と、Pentaho でHDFS を元に帳票を作成する方法を説明します。
以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいHDFS 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。
Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:hdfs: 次にセミコロン区切りで接続プロパティを入力します。
HDFS への認証には、次の接続プロパティを設定します。
以下は一般的なJDBC URL です:
jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
これで、HDFS の帳票を作成する準備が整いました。
帳票にHDFS データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。
クエリを設定します。この記事では次を使います:
SELECT FileId, ChildrenNum FROM Files WHERE FileId = '119116'