こんにちは。
最近、AIツールがどんどん増えていますよね。
そこで今回は、私が実際に使ってみた複数のAIツールをまとめて紹介します!
Dify
オープンソースのLLMアプリ開発プラットフォームです。
LangChainをより操作しやすくしたようなツールで、複数のAIを連携させることができます。
例えば、文章生成にClaude、情報検索にPerplexity、全体の構成にChatGPTというように、複数のAIを連携させて1つのフローとして実行できます。
また、作成したフローをAPIとして公開することも可能で、AIエージェントの開発にも活用できそうです。
なお、ローカル環境への導入にはGitとDockerが必要です。
インストール手順
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up
http://localhost/install
更新手順
cd dify/docker
git pull origin main
docker compose down
docker compose pull
docker compose up -d
実行手順
cd dify/docker
docker compose up -d
Cursor
Visual Studio Codeをベースに、AIによるコード生成サポート機能を搭載させたテキストエディターです。
プログラムの作成、プログラムの解説、テストケースの作成などをサポートしてくれます。
既にVisual Studio Codeをインストールしている場合は設定ファイルの混合を防ぐ目的で一旦削除してからインストールした方が良さそうです。
PhotoPrism
TensorFlowを活用したAI搭載の画像管理ツールです。
画像に写っているものを自動で解析し、タグ付けを行ってくれます。
ローカル環境に構築することで、ブラウザから大量の画像を一元管理することが可能になります。
こちらも導入にはGitとDockerが必要です。
インストール手順
wget https://dl.photoprism.app/docker/docker-compose.yml
pip install -r requirements.txt
実行手順
docker compose up -d
http://localhost:2342
EasyForge
Windows向けの画像生成AIのオールインワンパッケージです。
Forge(AUTOMATIC 1111の派生)とFluxを試せる環境とのことですが、他に比べ環境構築が簡単でかつ、有名どころの拡張機能も予め設定されたものになります。
ControlNet
EasyForgeに搭載されている画像生成支援の拡張機能です。
以下、実際に試した機能をいくつか紹介します。
OpenPoseモジュール
画像から人物を探し、姿勢(手足・胴体)を推定するアルゴリズムです。
サンプルとしてフリー素材ぱくたそさんから以下の画像を拝借しました。
こちらの画像を解析した結果は以下の通りです。
顔の位置、肩の位置、手足の位置が座標として取得出来ているのが確認できます。
解析結果の画像はControlNetのOpenPoseに対応している別のシステムでも使い回すことが可能です。
Depthモジュール
画像から距離を推定するアルゴリズムです。
この領域は同じ物体が映っているという情報を伝えることが出来ます。
画像生成AIにimage2imageというものがありますが、そちらは画像をお手本として別の画像を作りますが、Depthは距離情報だけを参考にするので構図を変えずに様々なバリエーションを提案してくれます。
以下が実行サンプルです。
コートや背景といった内容は維持しつつ色や中身が変化しているのが見て取れると思います。
ノイズ法/テクスチャ法(カムカム法)
こちらはモジュールではなく、イラストのディテールを大幅に引き上げる、StableDiffusion向けの特殊なテクニックになります。
なかなか興味深い内容となっているので合わせて紹介します。
https://note.com/mitsukinozomi/n/n500c7a9ea195
https://note.com/mitsukinozomi/n/ne51e2138a0f0
https://note.com/mitsukinozomi/n/n3b9fb82f2ed6
https://note.com/mitsukinozomi/n/n1c5913239ed8
https://note.com/mitsukinozomi/n/ne735cc59afd1
https://note.com/mitsukinozomi/n/n791b5304bdb7
まとめ
ツール名 | 概要 |
Dify | 様々なAIを組み合わせて1つにまとめる事が出来るツール |
Cursor | AIを使ってプログラミングをサポートしてくれるツール |
PhotoPrism | AIが画像管理をしてくれるツール |
EasyForge | AIが画像生成をしてくれるツール |
ControlNet | AIが画像生成をするときの補助ツール |
ControlNet-OpenPose | AIが画像生成する時に元画像から人物を探し出し姿勢を推定してくれる仕組み |
ControlNet-Depth | AIが画像生成する時に元画像から対象との相対距離に応じてグルーピングしてくれる仕組み |
ControlNet ノイズ法/テクスチャ法(カムカム法) | AIが画像生成する時に介入して精度を上げてくれる仕組み |
これらが参考になれば幸いです。