CILAS2025 Webアプリ
概要
CILAS2025 Web Appは、レーザー粒子解析装置(CILAS)が出力するPDFファイルを入力として受け取り、解析用のCSVファイルを生成すると同時に粒度分類(Shepard 1979、Folk 1954)を行うStreamlit製のインタラクティブなWebアプリです。ユーザーはPDFを1ファイルずつアップロードし、アプリ側でPDF内の生データを抽出して標準的なCSV形式に変換、さらに古典的な地質学的分類法に従った分類結果を表やダウンロード可能なファイルとして取得できます。リポジトリ自体は軽量で、READMEと画像ディレクトリ、ライセンスのみが含まれていますが、Streamlit公開リンクが示されており、実用的なプロトタイプとして機能していることが確認できます。
リポジトリの統計情報
- スター数: 1
- フォーク数: 0
- ウォッチャー数: 1
- コミット数: 5
- ファイル数: 3
- メインの言語: 未指定
主な特徴
- Streamlitで構築されたブラウザベースのUIによる手軽な操作性。
- CILASレーザー粒子解析装置が出力するPDFからの生データ抽出とCSV生成機能。
- Shepard(1979)およびFolk(1954)による粒度分類を自動適用して表形式で表示。
- Web上で動作するデプロイ済みのデモ(Streamlitアプリ)へのリンクを提供。
技術的なポイント
このプロジェクトは「PDF → 構造化データ(CSV) → 地質分類」というワークフローを単純化する点が特徴です。フロントエンドはStreamlitを用いたシンプルなUIを想定しており、ユーザーはファイルアップロード、結果表示、CSVダウンロードといった一連の操作をブラウザ上で完結できます。技術的に重要なポイントは次の通りです。
- PDF解析: CILAS装置が生成するPDFには、数値データ(粒径分布、体積比・重量比など)や図表が含まれるため、これらから生データを正確に抽出することが肝要です。実装にはPDFテキスト抽出ライブラリ(例: pdfminer、PyPDF2、tabula-pyなど)や、場合によってはOCRを組み合わせるアプローチが考えられます。表形式のデータが埋め込まれている場合は表検出と列整形が必要です。
- CSV生成とスキーマ: 抽出した生データを解析・再利用しやすいCSVに変換するため、列名や単位(μm、mmなど)を明示し、欠損値やメタデータ(サンプルID、測定日、装置設定)を含める設計が望ましいです。アプリではワンクリックでCSVを生成・ダウンロードできるUIを備えることで運用性が向上します。
- 粒度分類アルゴリズム: Shepard(1979)やFolk(1954)は粒度組成に基づく分類体系で、得られた粒度分布のパーセンタイルやモード、砂-泥分率などを計算し、分類基準に照らしてカテゴリを決定します。実装では、データに対する前処理(ノイズ除去、正規化)と、各分類基準の閾値に基づく判定ロジックを明確に定義することが重要です。
- デプロイとユーザビリティ: Streamlitでホスティングすることで研究者や現場担当者が容易に利用できますが、ファイルサイズや同時接続数、プライバシー面(アップロードされるデータの保持)に対する運用方針も設計段階で検討する必要があります。
本リポジトリ自体はまだ小規模なスケルトンに留まりますが、PDFパース精度の向上、分類ルールの透明化(計算過程の可視化)、単体テストやサンプルデータの追加などを進めれば実務で有用なツールに発展させられます。
プロジェクトの構成
主要なファイルとディレクトリ:
- LICENSE: file
- README.md: file
- images: dir
まとめ
シンプルだが実用的なPDF→CSV変換と古典的粒度分類を提供するStreamlitベースのプロトタイプ。
リポジトリ情報:
- 名前: CILAS_WEB_APP
- 説明: 説明なし
- スター数: 1
- 言語: null
- URL: https://github.com/nicorag/CILAS_WEB_APP
- オーナー: nicorag
- アバター: https://avatars.githubusercontent.com/u/35886546?v=4
READMEの抜粋:
CILAS2025 Web App
🎯 Descripción
CILAS2025 es una aplicación web interactiva desarrollada con Streamlit que permite … Cargar de a 1 archivo PDF generados por el analizador láser de partículas CILAS del SHN. Luego crea un archivo CSV con los datos crudos del archivo original. Además brinda la clasificación de Shepard 1979 y Folk 1954, tanto en formato tabla con en…