注目の記事 PICK UP!

気になっていたAIツールを色々試してみました

こんにちは。
最近、AIツールがどんどん増えていますよね。
そこで今回は、私が実際に使ってみた複数のAIツールをまとめて紹介します!

Dify

オープンソースのLLMアプリ開発プラットフォームです。
LangChainをより操作しやすくしたようなツールで、複数のAIを連携させることができます。
例えば、文章生成にClaude、情報検索にPerplexity、全体の構成にChatGPTというように、複数のAIを連携させて1つのフローとして実行できます。
また、作成したフローをAPIとして公開することも可能で、AIエージェントの開発にも活用できそうです。
なお、ローカル環境への導入にはGitDockerが必要です。

インストール手順

git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up
http://localhost/install

更新手順

cd dify/docker
git pull origin main
docker compose down
docker compose pull
docker compose up -d

実行手順

cd dify/docker
docker compose up -d

Cursor

Visual Studio Codeをベースに、AIによるコード生成サポート機能を搭載させたテキストエディターです。
プログラムの作成、プログラムの解説、テストケースの作成などをサポートしてくれます。
既にVisual Studio Codeをインストールしている場合は設定ファイルの混合を防ぐ目的で一旦削除してからインストールした方が良さそうです。

PhotoPrism

TensorFlowを活用したAI搭載の画像管理ツールです。
画像に写っているものを自動で解析し、タグ付けを行ってくれます。
ローカル環境に構築することで、ブラウザから大量の画像を一元管理することが可能になります。
こちらも導入にはGitDockerが必要です。

インストール手順

wget https://dl.photoprism.app/docker/docker-compose.yml
pip install -r requirements.txt

実行手順

docker compose up -d
http://localhost:2342

EasyForge

Windows向けの画像生成AIのオールインワンパッケージです。
Forge(AUTOMATIC 1111の派生)とFluxを試せる環境とのことですが、他に比べ環境構築が簡単でかつ、有名どころの拡張機能も予め設定されたものになります。

ControlNet

EasyForgeに搭載されている画像生成支援の拡張機能です。
以下、実際に試した機能をいくつか紹介します。

OpenPoseモジュール

画像から人物を探し、姿勢(手足・胴体)を推定するアルゴリズムです。
サンプルとしてフリー素材ぱくたそさんから以下の画像を拝借しました。

こちらの画像を解析した結果は以下の通りです。

囲み枠a

顔の位置、肩の位置、手足の位置が座標として取得出来ているのが確認できます。
解析結果の画像はControlNetのOpenPoseに対応している別のシステムでも使い回すことが可能です。

Depthモジュール

画像から距離を推定するアルゴリズムです。
この領域は同じ物体が映っているという情報を伝えることが出来ます。
画像生成AIにimage2imageというものがありますが、そちらは画像をお手本として別の画像を作りますが、Depthは距離情報だけを参考にするので構図を変えずに様々なバリエーションを提案してくれます。
以下が実行サンプルです。

コートや背景といった内容は維持しつつ色や中身が変化しているのが見て取れると思います。

ノイズ法/テクスチャ法(カムカム法)

こちらはモジュールではなく、イラストのディテールを大幅に引き上げる、StableDiffusion向けの特殊なテクニックになります。
なかなか興味深い内容となっているので合わせて紹介します。
https://note.com/mitsukinozomi/n/n500c7a9ea195
https://note.com/mitsukinozomi/n/ne51e2138a0f0
https://note.com/mitsukinozomi/n/n3b9fb82f2ed6
https://note.com/mitsukinozomi/n/n1c5913239ed8
https://note.com/mitsukinozomi/n/ne735cc59afd1
https://note.com/mitsukinozomi/n/n791b5304bdb7

まとめ

ツール名概要
Dify様々なAIを組み合わせて1つにまとめる事が出来るツール
CursorAIを使ってプログラミングをサポートしてくれるツール
PhotoPrismAIが画像管理をしてくれるツール
EasyForgeAIが画像生成をしてくれるツール
ControlNetAIが画像生成をするときの補助ツール
ControlNet-OpenPoseAIが画像生成する時に元画像から人物を探し出し姿勢を推定してくれる仕組み
ControlNet-DepthAIが画像生成する時に元画像から対象との相対距離に応じてグルーピングしてくれる仕組み
ControlNet
ノイズ法/テクスチャ法(カムカム法)
AIが画像生成する時に介入して精度を上げてくれる仕組み

これらが参考になれば幸いです。

アバター画像

610birth

ITエンジニアとして活動しています。
10年以上前に構文解析のパッケージ開発を手掛けたことをきっかけに、自然言語処理やChatGPTに興味を持つようになりました。
2022年からはStable Diffusionにも関心を持ち始め、現在はさまざまなAIをローカルに構築し、楽しんでいます。

関連記事

  1. AIとCanvaでできる!マンガの作り方

  2. AIマンガが出来るまで

  3. Gen AI Summit Tokyo ’24 秋 レポート #gc_genai

  4. GitHub Copilotの使い方

PAGE TOP