2025年11月10日
前回の記事 で作った PostgreSQL + pgvector を使って、一般的な RAG で用いられるコサイン類似度検索やハイブリッド検索(Reciprocal Rank Fusion = RRF)を実装してみました。 ## 環境 * PostgreSQL 16.10 * pgvector 0.8.1 * pg_trgm 1.6 * Python 3.12.0 * langchain 1.0.5 * langchain-huggingface 1.0.1 * pgvector
2025年11月4日
毎日 AI Agent についての話題は絶えないですが、一方で「Agent って何?」みたいな人もいるかと思います。 今回はノーコード AI アプリ開発ツールである Dify を使って、LLM、RAG、Agent の違いをミニマルな形で手を動かして学んでみようと思います。とある機会でデモとして用意した内容なので、サクサクと手を動かしていければ準備を含めても30分くらいでいける内容だと思います。 ## 前提条件 * Dify SaaS 版 に登録済み * Google AI Studio の API キ
2025年9月15日
Dify で会話しながら、AI が資料を探してくれて RAG ナレッジベースへの資料の追加までやってくれたら便利かもと思ったのでやってみました。 ## 環境 * Dify クラウド版(無料プラン) ## できたもの ```youtube MqhuiDMH3dM ``` 動画では、途中エージェント部分の処理は長いので4倍速にしています。 DSL ファイルはこちらです。 GoogleSearch.yml 動かすために必要なのは以下です。 * Gemini API キー(今回は Google
2025年5月9日
RAG システムの精度を評価するためのフレームワークとして2023年に RAGAS が提案されてから、RAGAS は進化を続けていて2025年5月時点では RAG において8つの指標が定義されています。[^1] ^1]: 論文に登場する3つの指標のうち Context Relevancy は既に廃止されています。Nvidia metrics の中にある [Context Relevance は計算方法が異なるため、別物です。 RAGAS を利用するメリットとして、一番大きな点は人間が作った正解のデータ