microAI
Get started
microAI
Blog
topic: LLM
microAI Blog
topic: LLM
Dify で使うためにベクトルDBの Milvus を Kubernetes のクラスターにデプロイして、高品質インデックス化を行う
Jun 6, 2024, 11:19 PM
前回「Kubernetes に Dify をインストールして、Cloudflare Tunnel でインターネット経由で見られるようにしたときの備忘録」で Dify をインストールしましたが、この手順では、ベクトルDBの Milvus がインストールされていませんので、インデックス方法で「高品質」を選択するとエラーになります。
Kubernetes に Dify をインストールして、Cloudflare Tunnel でインターネット経由で見られるようにしたときの備忘録
Jun 6, 2024, 7:23 AM
Dify が話題でしたので、インストールして使ってみました。結論、「やばい」です。世界を変えるレベルですね。これがオープン・ソースで提供されているのが本当に驚きです。今後も色々と使ってみたいと思いますが、まずは、Kubernetes にデプロイしたときのメモを残しておきます。
より良い回答を得るための LLM プロンプトエンジニアリング
May 31, 2024, 5:59 AM
chatGPT など、LLM (大規模言語モデル) に出す指示 (プロンプト) をより良くするためのテクニックをまとめてみたいと思います。
Hugging Face のモデル(GGUF)を ollama で使うまでの5ステップ
May 30, 2024, 6:35 AM
Hugging Face では日々、日本語にチューニングされたモデルが公開されていますが、それらを ollama で使用するまでの流れを忘れがちなのでメモとして残しておきます。
1台のGPUのVRAMに収まらないLLMモデルを 2台で分散してみたら動いた話
May 26, 2024, 6:44 PM
Jetson Orin Nano NX 16G が2台手元にありますので、VRAMに収まらないモデルを分散推論させることで動かしてみます。
日本語に強い! cyberagent/calm2-7b-chat を ollama で使ってみる
May 23, 2024, 9:02 PM
日本語に強いLLM探しの旅をしています。今回は、 cyberagent/calm2-7b-chat をollama で使ってみます。
Google Colab で、Base model を Instruct model へとチューニングする
May 19, 2024, 2:40 PM
ベースモデルをインストラクトモデル(指示モデル)にチューニングする方法について学んでいきます
HuggingFace Model (Llama 3 Youko 8B) を GGUF に変換して、ollama で実行する
May 18, 2024, 12:09 PM
HuggingFace Model を GGUFへの変換について勉強したときのログです。変換したモデルを最後に ollama で使ってみます。