400万人が利用するビジネスSNS
新潟大学農学部を卒業後、アルゼンチンへワーキングホリデーへ。 その後大好きなコーヒーを勉強したくてコロンビアに滞在。 現在は北海道にいます。
コロンビアでコーヒーの買い付けの様子を写真や動画撮影、編集するお仕事をした経験から、 動画制作、ブランディング、自分でプロダクトを作れるようになりたい。
果樹蔬菜園芸学の研究室に所属。 新潟の特産品である西洋ナシ「ル・レクチェ」の追熟に関する研究をしています。 収穫後の果実の内生植物ホルモンを分析が主な研究内容です。
講義音声の自動文字起こし&整理 Python+OpenAI Whisper(CUDA対応)で MP3 → テキスト/SRT/JSON/VTT へ一括変換 スクリプト(transcribe_and_organize.py)でファイルごとにフォルダ分けし、後続処理がしやすいディレクトリ構成を自動生成 テキストのベクトル化&検索インデックス構築 LangChain の DirectoryLoader → RecursiveCharacterTextSplitter でドキュメント分割 HuggingFace の埋め込みモデル(intfloat/multilingual-e5-small)で各チャンクをベクトル化 FAISS をローカル DB として保存し、高速な類似度検索が可能に AI対話エンジンの実装 Ollama(ローカル LLM)を RetrievalQA チェーンに組み込んで、ユーザーの質問に対し講義内容から根拠付きで回答 質問・回答ログをフォルダ内に自動追記し、あとから振り返り可能に Web UI(Streamlit)化 Streamlit で「講義選択 → 質問入力 → 回答表示」のシンプルなインターフェースを作成 キャッシュ機構(@st.cache_resource)でインデックス読み込みと QA チェーン生成を最適化 Dockerコンテナ化&ネットワーク化 各コンポーネント(transcriber, ingester, app)を個別コンテナに分割 Docker Compose で一発起動ワークフローを構築 Ollama サーバーと Streamlit アプリを同一コンテナに共存させるエントリポイントを作成し、ネットワーク設定の複雑さを解消 CI/CD/Observability の導入(構想) GitHub Actions で「ビルド→テスト→デプロイ」を自動化するパイプライン OpenTelemetry+Grafana でリクエスト遅延やエラー率を可視化し、Slack 通知によるアラート発報を計画