【2025年版】用途別おすすめAIツール一覧|商用利用の可否、機能、料金などをまとめた完全保存版

   2025/12/30



昨今、AIの数は急速に増えました。

需要の高い画像生成や動画生成、音声生成など、AIの数が多くてどれを使ったらいいか迷いますよね。

本記事では「実際に使えるAIツール」を用途別に整理し、具体例や比較表、FAQも交えてわかりやすく解説します。初心者でもすぐに活用できる内容になっています。

基本的にGoogleアカウントでログインすると使える無料のAIがメインとなります。一部の機能を解除するには有料プランが用意されているものがほとんどですが、無料でも充分使えますので試してみてください。

この記事は私自身の備忘録も兼ねて、すぐに確認できるようにまとめています。




目次

結論|用途に合ったAIを選べば作業効率が大幅アップ

AIは万能ではありませんが、目的ごとに最適なツールを選べば、ブログ執筆・デザイン・開発・SNS運用などの作業効率を大幅に向上できます。

ただし、精度やレスポンスなどはAIによって様々です。

まずは実際に使ってみて、ご自分に合うAIを探すことから始めてみてください。



用途別AI 比較表

近年は用途別に最適化されたAIツールが数多く登場しています。
ここでは「文章生成・画像生成・開発支援・業務効率化」などの用途別に、
代表的なAIツールを比較できる一覧表をまとめました。

用途 AIツール名 主な特徴 得意なこと 向いている人
文章生成 ChatGPT 汎用性が高く日本語精度が高い ブログ執筆・構成作成 初心者〜上級者
文章生成 Claude 長文処理と自然な文章 要約・資料整理 ビジネス利用者
文章生成 Gemini 検索・調査との相性が良い リサーチ・情報整理 調査重視の人
文章生成 Grok X(旧Twitter)と連携したリアルタイム情報 トレンド調査 最新情報を追いたい人・Xユーザー
文章生成 Perplexity 高速レスポンスと出典付き検索 調査・ファクトチェック 調査重視の人
画像生成 Midjourney 高品質で芸術性が高い アイキャッチ・デザイン デザイナー
画像生成 DALL·E 直感的で扱いやすい イラスト作成 初心者
画像生成 Stable Diffusion 自由度が高くローカル利用可 商用画像生成 上級者
画像生成 Leonardo.ai 無料枠が多く独自モデルを採用 イラスト・ゲーム素材制作 初心者~上級者
開発支援 GitHub Copilot コード補完特化 実装スピード向上 エンジニア
開発支援 Cursor AI統合エディタ コード修正・理解 開発者
動画生成 Runway 動画生成・編集が簡単 SNS動画制作 動画制作者
動画生成 Sora 動画生成・編集が簡単 SNS動画制作 動画制作者
音声生成 ElevenLabs 自然な音声生成 ナレーション YouTuber
業務効率化 Notion AI 要約・整理が得意 議事録・メモ ビジネスパーソン
業務効率化 Microsoft Copilot Office製品と連携 資料・表計算 会社員
SNS運用 Canva AI デザインが簡単 投稿画像作成 SNS運用者
用途:文章生成
AIツール名:ChatGPT
主な特徴:汎用性が高く日本語精度が高い
得意なこと:ブログ執筆・構成作成
向いている人:初心者〜上級者

用途:文章生成
AIツール名:Claude
主な特徴:長文処理と自然な文章
得意なこと:要約・資料整理
向いている人:ビジネス利用者

用途:文章生成
AIツール名:Gemini
主な特徴:検索・調査との相性が良い
得意なこと:リサーチ・情報整理
向いている人:調査重視の人

用途:文章生成
AIツール名:Grok
主な特徴:X(旧Twitter)と連携したリアルタイム情報
得意なこと:トレンド調査
向いている人:最新情報を追いたい人・Xユーザー

用途:文章生成
AIツール名:Perplexity
主な特徴:高速レスポンスと出典付き検索
得意なこと:調査・ファクトチェック
向いている人:調査重視の人

用途:画像生成
AIツール名:Midjourney
主な特徴:高品質で芸術性が高い
得意なこと:アイキャッチ・デザイン
向いている人:デザイナー

用途:画像生成
AIツール名:DALL·E
主な特徴:直感的で扱いやすい
得意なこと:イラスト作成
向いている人:初心者

用途:画像生成
AIツール名:Stable Diffusion
主な特徴:自由度が高くローカル利用可
得意なこと:商用画像生成
向いている人:上級者

用途:画像生成
AIツール名:Leonardo.ai
主な特徴:無料枠が多く独自モデルを採用
得意なこと:イラスト・ゲーム素材制作
向いている人:初心者~上級者

用途:開発支援
AIツール名:GitHub Copilot
主な特徴:コード補完特化
得意なこと:実装スピード向上
向いている人:エンジニア

用途:開発支援
AIツール名:Cursor
主な特徴:AI統合エディタ
得意なこと:コード修正・理解
向いている人:開発者

用途:動画生成
AIツール名:Runway
主な特徴:動画生成・編集が簡単
得意なこと:SNS動画制作
向いている人:動画制作者

用途:動画生成
AIツール名:Sora
主な特徴:動画生成・編集が簡単
得意なこと:SNS動画制作
向いている人:動画制作者

用途:音声生成
AIツール名:ElevenLabs
主な特徴:自然な音声生成
得意なこと:ナレーション
向いている人:YouTuber

用途:業務効率化
AIツール名:Notion AI
主な特徴:要約・整理が得意
得意なこと:議事録・メモ
向いている人:ビジネスパーソン

用途:業務効率化
AIツール名:Microsoft Copilot
主な特徴:Office製品と連携
得意なこと:資料・表計算
向いている人:会社員

用途:SNS運用
AIツール名:Canva AI
主な特徴:デザインが簡単
得意なこと:投稿画像作成
向いている人:SNS運用者

文章作成・ライティングに使えるAI

文章作成系AIは、ブログ執筆や資料作成など、コンテンツ制作全般の効率を大きく向上させます。

また、何かを調査したい時や、ソースを確認したい時にも時間短縮できて非常に便利です。

レスポンスの速さや文章作成の精度など、ご自分の要望に合ったAIを選ぶことで強力な助っ人となります。

ChatGPT

画像出典:ChatGPT公式サイト https://chatgpt.com/

公式リンク: https://openai.com/ja-JP/?utm_source=chatgpt.com

ChatGPT(チャットジーピーティー)はOpenAIという会社が開発したAIチャットボットです。

OpenAIは2015年に設立されたアメリカの人工知能研究企業で、ChatGPTはGPT(Generative Pre-trained Transformer)という言語モデルをベースにしています。

認知度も高く、定番のAIなので使っている方も多いと思います。

文章生成・要約・翻訳・アイデア出しなど幅広く活用可能です。初心者から上級者まで幅広く利用されています。

レスポンスが若干遅い時もありますが、「最初に試すならコレ」と言えるほど汎用的に使うことができるAIです。

ChatGPTの主な機能

ChatGPTの主な機能は、従来のテキスト生成を超え、2025年現在は「高度な推論(考えるAI)」「自律的な調査」「共同編集ワークスペース」へと大きく進化しています。

カテゴリ 機能名 解説 メリット・活用例
高度な思考・検索 o1 / o3-pro モデル 回答前に複雑な推論(Internal Reasoning)を行う最新モデル。 科学研究、高度な数学、難解なバグの修正。
Deep Research 何十ものサイトを巡回し、数分かけて本格的なレポートを作成。 市場分析や技術調査など、人間なら数時間かかるリサーチの自動化。
ChatGPT Search ウェブ上の最新情報を引用元(ソース)付きで回答。 ニュース、株価、スポーツの結果などリアルタイム情報の取得。
共同作業・編集 Canvas(キャンバス) チャットとは別に、文書やコードを直接編集できる専用画面。 AIと対話しながら記事を執筆したり、コードをデバッグ。
Projects(プロジェクト) 関連するチャット、ファイル、指示を一つの場所に整理。 長期的な仕事や、特定の資料に基づいた一貫性のある作業。
マルチモーダル Advanced Voice 感情豊かな音声でリアルタイムに対話。ビデオ共有も可能。 面接の練習や、カメラで映した目の前の風景について相談。
DALL·E 3 / 生成機能 高品質な画像生成に加え、画像内への正確な文字入れ。 ロゴ作成、資料用イラスト、デザインのバリエーション出し。
Vision(画像理解) アップロードした画像や図表、手書きメモを高度に解析。 グラフからのデータ抽出、手書きの要件定義書をコード化。
パーソナライズ Memory(メモリ) ユーザーの好みや過去に話した事実を記憶。 「自分の文体」や「特定のプロジェクトの背景」をAIが学習。
GPTs(カスタム版) 特定の目的(例:ロゴ作成、論文検索)に特化した専用AI。 特定の業務に最適化した自分専用ツールをノーコードで作成。

ChatGPTの料金プラン(2025年12月現在)

フリープランは初心者・ライトユーザー向けで、最新のフラッグシップモデルを試すことができますが、利用回数を超えると小型で高速なモデル(mini系)に自動で切り替わります。また、画像生成や高度なデータ分析ツールにも回数制限があります。

個人で本格的に活用したい方はPlusプランが最適です。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://chatgpt.com/#pricing

画像出典:ChatGPT公式サイト https://chatgpt.com/#pricing

Claude

画像出典:Claude公式サイト https://claude.ai/

公式リンク: https://claude.ai/

Claude(クロード)は、Anthropicという企業が開発したAIアシスタントです。

現在のモデルはClaude Sonnet 4.5(Claude 4ファミリーの最新で最も賢いモデル)です。

ウェブ、スマホアプリ、デスクトップアプリ、APIなどで使うことができます。

ウェブ検索、コード作成、ファイル作成、リサーチ、過去の会話の検索など、長文処理に強く、資料要約や文章整理に向いています。

文章のトーンやスタイルを自分好みに設定することも可能です。

コーディングに強く、開発者やコーディングを必要としている人に人気があるAIです。開発者向けには、ターミナルから直接Claudeにコーディングタスクを依頼できる「Claude Code」というツールもあります。

レスポンスは若干遅め。また、調査目的で使うと、希望とは違う情報を引っ張ってくることがあるのでそこはよく確認する必要があります。

Claudeの主な機能

Claude(クロード)の主な機能は、2025年リリースの最新モデル「Claude 3.7 Sonnet」によるハイブリッドな思考能力と、AIとの共同作業を支える独自のツール群に集約されています。

カテゴリ 機能名 解説 メリット・活用例
高度な知能 拡張思考モード 回答前に「内部で熟考」するプロセスを可視化する新機能。 複雑なデバッグ、数学、戦略立案などの難問解決。
ハイブリッド思考 「即答」と「熟考」を1つのモデルで使い分け可能。 日常のチャットは高速に、重要な仕事は深く考える。
作業効率化 Artifacts コードやデザイン、文書をチャットとは別画面でプレビュー。 Webサイト制作、図表作成、アプリの即時実行・編集。
Projects 特定の資料や指示をまとめた専用ワークスペースを作成。 社内規定やコード規約に基づいた、一貫性のある回答。
マルチモーダル Vision(視覚認識) 画像、グラフ、スクリーンショットを読み取り分析。 手書きメモのデータ化や、エラー画面の解決法提示。
Computer Use AIが画面を認識し、マウス操作や入力を自律的に代行。 複数のWebサイトを巡回してデータを入力する自動化。
開発者向け Claude Code ターミナルから直接AIと対話し、コードを生成・修正。 大規模リポジトリ全体の改善や新機能の実装。
長文出力(128K) 以前の15倍以上に及ぶ、極めて長い回答の生成が可能。 論文1冊分の執筆や、数千行にわたるプログラム作成。

Claudeの料金プラン(2025年12月現在)

Claude(クロード)の料金プランは、2025年現在、個人向けの無料プランからプロユーザー、チーム、大規模企業向けまで幅広く展開されています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://claude.com/pricing

画像出典:Claude公式サイト https://claude.com/pricing

Gemini

画像出典:Gemini公式サイト https://gemini.google.com/

公式リンク: https://ai.google/?utm_source=chatgpt.com

Google Geminiは、GoogleがBardという名前で発表した後、2024年2月にGeminiに改称された対話型AIです

Google連携が強く、Gmail、YouTube、Googleマップなど、Googleの各種サービスと連携できる点が、他のAIと異なる特徴でありメリットです。

マルチモーダルAI(複数の種類の異なるデータを一度に理解・処理できるAI)が採用されています。文章、画像、音声などの情報を組み合わせて高度な判断ができるAIアシスタントです。GPT-4o (OpenAI)やClaude 3.5 Sonnet (Anthropic)にも採用されています。

レスポンスも速く、幅広い用途で使えます。

Geminiの主な機能

Geminiの主な機能は、Googleの検索エンジンやWorkspace(Gmail、ドキュメント等)との強力な連携、そして2025年に登場した最新の推論・マルチモーダル機能に集約されています。

カテゴリ 機能名 解説 メリット・活用例
高度な対話・推論 Gemini Live 自然な音声でリアルタイムに対話。カメラや画面の共有も可能。 面接の練習、スマホで映している風景や故障箇所の相談。
Deep Research 複数のステップを経てネットを深く調査し、詳細なレポートを作成。 市場調査や旅行のしおり作成など、複雑な調査の自動化。
Deep Think 回答前に「思考プロセス」を展開し、論理的に深い分析を行う。 難解なプログラミングのデバッグ、数学、戦略立案。
マルチモーダル生成 画像・動画生成(Veo 3) テキストから高品質な画像や動画(Veo 3搭載)を生成。 プレゼン資料用の挿絵や、SNS用の短い動画クリップ制作。
Canvas AIと共同作業するための専用エディタ画面。 コードの修正や執筆を、チャットとは別の画面で並行作業。
Google連携 Workspace 連携 Gmail、ドキュメント、スプレッドシート内でAIが直接支援。 メールの代筆・要約、Docsでの構成案、Sheetsのデータ分析。
Google拡張機能 Googleマップ、YouTube、カレンダー等の情報を直接取得。 「来週の予定を教えて」「この動画の内容を3行で要約して」。
分析・カスタマイズ 長文コンテキスト 最大100万〜200万トークンの膨大な情報を一度に処理。 本数冊分の資料や、1時間を超える動画の内容を丸ごと解析。
Gem(ジェム) 特定の役割や専門知識を持たせた自分専用のAIを作成。 「専属の英語教師」や「コードレビュアー」として固定化。

Geminiの料金プラン(2025年12月現在)

Geminiの料金プランは、個人向け(Googleアカウント単体での利用)と法人向け(Google Workspaceとの統合利用)の2つに大きく分かれています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://one.google.com/plans?g1_landing_page=7

プラン名 料金(月額) 特徴・主な機能
無料 0円 基本機能を利用可能。
最新の軽量モデル(Gemini Flash など)に対応。回数制限あり。
Google AI Pro 2,900円 標準的な有料プラン。
最新モデル「Gemini 3 Pro」を優先利用可能。
2TBストレージ、Gemini Live(音声対話)、Deep Research に対応。
Google AI Ultra 36,400円 プロ・研究者向け最上位プラン。
最上位モデルへのほぼ無制限アクセス、30TBストレージ、YouTube Premium特典付き。

Grok

画像出典:Grok公式サイト https://grok.com/

公式リンク: https://grok.com/

Grok(グロック)は、イーロン・マスク氏が設立したAI企業 xAI(エックスエーアイ) が開発した対話型AIです。

「宇宙の真理を理解する」というミッションを掲げており、2025年現在、最新モデルの Grok 4.1 がリリースされています。

他のAIと比較して、SNSの「X(旧Twitter)」と深く統合されている点が最大の特徴です。

Xの膨大なリアルタイム投稿にアクセスできるため、世の中で「今まさに起きていること」について、どのAIよりも早く正確に把握し、回答するのが強みです。

また、標準的な回答だけでなく、皮肉(ウィット)の効いた面白い回答をする「ファン・モード」や、より過激な「アンヒンジド(Unhinged)モード」など、キャラクターを切り替えることができます。

マルチモーダル対応で、テキスト、画像、音声の処理が可能。2025年のアップデートにより、静止画を動画化する機能や、音声だけで画像を生成する機能も追加されています。

高度な推論(Thinkモード)では、複雑な数学、科学、プログラミングの問題に対して、一歩立ち止まって論理的に考えてから回答する機能が搭載されています。

Tesla車の音声アシスタントとして採用されており、ナビゲーションや車両の状態確認が可能です。また、人型ロボット「Optimus」の脳としても活用されています。

現在、用途に合わせて複数のモデルが提供されています。

Grok 4.1

最新のフラッグシップモデル。高い知能に加え、感情的な理解(EQ)が大幅に強化されています。

Grok 4.1 Fast

応答速度とコスト効率を重視したモデル。

Grok Code Fast

プログラミング(エージェント開発)に特化した高速モデル。

Grokの主な機能

カテゴリ 機能名 解説 メリット・活用例
検索・リサーチ Real-time Search X上の投稿や最新ニュースを秒単位で分析し、回答に反映。 進行中のイベントや最新のトレンド情報を即座に把握。
DeepSearch ネット上の膨大な情報を深く巡回し、根拠を示しながら詳細に調査。 複雑な市場動向や、複数のソースが必要な調査レポート作成。
推論・専門性 Think(思考)モード AIが回答前に「じっくり考える」プロセスを可視化する推論モード。 高度な数学、物理、プログラミングのデバッグに最適。
Big Brain Mode 膨大な計算リソースを集中させ、極めて複雑な論理問題を解決。 科学研究やデータ分析、戦略立案などの「重い」タスク用。
マルチモーダル 画像生成・理解 テキストからの画像生成、およびアップロードした画像の高度な分析。 生成した画像の一部を言葉で修正したり、写真の内容を解説。
ドキュメント分析 PDFや長大なテキストファイルを100万トークン規模で読み込み。 論文、契約書、ソースコード全体の内容把握とQ&A。
体験・外部連携 Personality設定 回答スタイルを「Fun(ユーモア)」「Standard(標準)」から選択。 AI特有の堅苦しさを排除し、親しみやすい対話が可能。
Tesla 連携 Tesla車内での音声アシスタントとして機能。 運転中のナビ操作、周辺情報の検索、ハンズフリー対話。
Collections API 独自のRAG(検索拡張生成)システムを構築できる開発者向け機能。 特定の知識ベースを持たせた自社専用AIアプリの開発。

Grokの料金と利用方法(2025年12月現在)

主に3つのルートで利用できます。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://grok.com/#subscribe

アクセス方法 対象・料金 特徴
X Premium / Premium+ 月額 $8 / $40 Xのアプリ内で利用可能。
Premium+なら最新のGrok 4.1を優先利用できる。
SuperGrok(独自アプリ) 月額 約$30 Xを通さず、単体のGrokアプリやWebサイトで
高度な機能を利用可能。
xAI API 従量課金 開発者が自社アプリにGrokを組み込むための
API提供窓口。

画像出典:Grok公式サイト https://grok.com/#subscribe

フリープランは機能に制限がありますが、Xにアカウントを持っている場合、左メニューからGrokを選択して利用できます。

Grokは「今のX」を見ているためニュース関連のリサーチに強いです。ただし、フリープランでは時間帯により混雑していて使えないこともしばしばあります。

Grokは画像生成もできますので、Xユーザーは「Grokで画像生成してPostに添付」と言うような使い方をしている人も多いです。

Perplexity

画像出典:perplexity公式サイト https://www.perplexity.ai/

公式リンク: https://www.perplexity.ai/

Perplexity(パープレキシティ)は、米国カリフォルニア州サンフランシスコに拠点を置くスタートアップ企業 Perplexity AI,Inc.によって開発されたAI検索(回答)エンジンです。

「AIアシスタント付きの回答エンジン/検索エンジン」として設計されており、従来の検索よりも少ない操作で答えと根拠にたどり着けることを目的にしています。

検索+アシスタントという位置づけで、質問への回答だけでなく、根拠情報の取得や資料化までを支援する点が特徴です。

Perplexityの回答は引用元が明示され、元情報へ直接飛べるリンクが付くため、信頼性を自分で確かめられる設計です。これが一般的な生成AIとの大きな違いです。

レスポンスも速く、何かを調査したい時はPerplexityがおすすめです。

Perplexityの主な機能

カテゴリ 機能名 解説 メリット・活用例
検索・リサーチ Pro Search 質問の意図をAIが深掘りし、必要があれば逆質問をしてから検索を実行。 曖昧な質問でも、AIが意図を確認して精度の高い回答を導き出す。
Deep Research 数十のソースを巡回し、数分かけて数千文字の詳細レポートを自動作成。 市場調査や競合分析など、数時間かかる調査業務を数分で完了させる。
引用元(Citations) 回答のすべての根拠となるWebサイトのリンクを番号付きで明示。 情報の信頼性を即座に確認でき、「AIの嘘(ハルシネーション)」を防ぐ。
モデル・ツール モデルセレクター GPT-5.2、Claude 4.5、Gemini 3 Pro、自社モデル(Sonar)などを自由に切替。 「推論ならClaude」「速さならSonar」など、用途に合わせて最強のAIを選べる。
Comet(AIブラウザ) Perplexityが開発したChromiumベースのブラウザ。検索と閲覧が一体化。 ブラウザを切り替えずに、閲覧中のページを即座に要約・分析。
ファイル分析 PDF、CSV、ドキュメント、画像をアップロードして内容を解析。 膨大な社内資料や論文から必要なデータだけを抽出・グラフ化。
管理・共有 Pages 検索結果をブログやWeb記事のような見栄えの良い形式に自動変換。 調査結果をそのままチームや外部へ公開可能なリンクとして共有。
Spaces プロジェクトごとに検索履歴やファイルを整理・保存できる共有スペース。 チームメンバーを招待し、共通の知識ベースとしてリサーチを共同で行う。
Focus(フォーカス) 検索対象を「学術論文」「YouTube」「Reddit」などに限定。 信頼性の高い論文だけを探したり、リアルな口コミだけを抽出したりする。

Perplexityの料金プラン(2025年12月現在)

Perplexityの料金プランは、2025年現在、個人向けの無料版からプロユーザー、さらに組織向けのプランまで幅広く展開されています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://www.perplexity.ai/pro

画像出典:Perplexity公式サイト https://www.perplexity.ai/pro




画像生成・デザインに使えるAI

画像生成AIは、アイキャッチやSNS投稿などのビジュアル制作を手軽に行えるのが魅力です。 クオリティ重視か手軽さ重視かという視点で、それぞれのAIの特徴を紹介します。

無料版のほとんどは1日の画像生成に制限があります。納得の行く画像生成AIを見つけたら、ご自身の財布と相談して有料版にアップグレードするのも良いと思います。

Midjourney

画像出典:Midjourney公式サイト https://www.midjourney.com/home

公式リンク: https://www.midjourney.com/home

Midjourney(ミッドジャーニー)は、アメリカのサンフランシスコを拠点とする独立した研究チーム「Midjourney Inc.」が開発・運営している、テキスト(プロンプト)から高品質な画像を生成するAIサービスです。

特にイラスト・アート・コンセプトデザイン分野に強く、他の画像生成AIと比べても「作風の美しさ」に定評があります。

デザイナー用途だけでなく、SNS投稿用画像やアイコン、NFT制作にも多く使われています。

以前はコミュニケーションツールのDiscord(ディスコード)上でのみ利用可能でしたが、現在は公式Web版での生成も提供されています。

現在、Midjourneyには無料トライアル枠はなく、完全有料制です。一番安いBasic Planは月額10ドル〜(月約3.3時間の高速生成)となっています。

高品質な画像を作成したい人はMidjourneyを検討してもいいのではないでしょうか。

Midjourneyの主な機能

2025年現在は高機能なWeb版インターフェースが中心となり、直感的な操作が可能になっています。

カテゴリ 機能名 解説 主なメリット・用途
Webエディタ Smart Select AIが画像内の被写体を自動認識し、クリックだけで選択。 背景削除や特定の物体のみの書き換えが数秒で完了。
Webエディタ Retexture 画像の形状や構造を維持したまま、質感・素材・照明だけを変更。 同じ形の椅子を「木製」から「金属製」へ瞬時に変更。
Webエディタ Layer(レイヤー) 複数の画像を重ねて合成し、位置やサイズを個別に調整。 人物と背景を別々に生成して組み合わせる高度な合成。
一貫性の維持 Character Ref(–cref) 特定の人物画像を「キャラクター参照」として固定。 同じ顔のキャラクターを異なる服装や場面で登場させる。
一貫性の維持 Style Ref(–sref) 参照画像の「画風・タッチ・色使い」をコピー。 シリーズ作品でアートスタイル(筆致や雰囲気)を統一。
一貫性の維持 Personalization(–p) ユーザーの好みの傾向をAIが学習し、独自の味付け。 「自分好みのテイスト」を自動的に全画像に反映。
生成後の調整 Vary Region 画像の一部を指定して、プロンプトで部分的に修正。 「モデルにメガネをかけさせる」などのピンポイント修正。
生成後の調整 Pan / Zoom Out キャンバスを上下左右に広げたり、カメラを引く。 描き足りない背景をAIに推測させて追加生成。
生成後の調整 Upscale 画像の細部を維持(または補完)して高解像度化。 印刷や大画面表示に耐える4Kレベルのクオリティに向上。
制御パラメータ Aspect Ratio(–ar) 画像の縦横比(アスペクト比)を数値で指定。 YouTube用(16:9)やSNS用(9:16)など用途別に出力。
制御パラメータ Stylize(–s) Midjourney特有の「芸術性の強さ」を調整。 リアル志向から幻想的表現まで強弱を制御。

Midjourneyの料金プラン(2025年12月現在)

Midjourney(ミッドジャーニー)の料金プランは、「GPU時間(高速生成できる時間)」と「Relaxモード(無制限生成)」の有無によって4つのティアに分かれています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://www.midjourney.com/account/

画像出典:Midjourney公式サイト https://www.midjourney.com/

DALL·E

画像出典:DALL·E公式サイト https://openai.com/ja-JP/index/dall-e-3/?utm_source=chatgpt.com


DALL·E(ダリース)は、ChatGPTの開発元として知られるOpenAI(オープンエーアイ)が開発した、テキストの指示から画像を生成するAIです。

名前の由来は、画家の「サルバドール・ダリ(Salvador Dalí)」とピクサーのアニメ映画「ウォーリー(WALL-E)」を掛け合わせたものと言われています。

現在は最新バージョンのDALL·E 3が広く利用されています。

DALL·Eは「言葉の指示を最も正確に理解してくれるAI」と言えます。「こういうシーンを、こういうレイアウトで描いてほしい」という具体的な指示がある場合や、ChatGPTを使い慣れている方に適しています。

DALL·Eの主な機能

DALL·E 3は、ChatGPTと完全に統合されていることが最大の特徴で、専門的なプロンプトを覚えなくても自然な会話で画像を生成・編集できる点が強みです。

カテゴリ 機能名 解説 メリット・活用例
生成機能 自然言語理解 曖昧な指示や長文から、意図を正確に読み取って画像を生成。 「和菓子を食べて感動している猫」など、日常語で指示可能。
プロンプト自動最適化 短い指示をAIが理解しやすい詳細な表現に自動拡張。 専門知識がなくても安定して高品質な画像を生成。
文字の描写 画像内に指定したテキストを正確に埋め込み可能。 ロゴ・表紙・看板デザインの制作が容易。
編集機能 画像編集(Inpainting) 生成後の画像の一部を選択して修正・追加・削除。 「人物のメガネを外す」など部分修正が簡単。
アウトペインティング 画像の外側をAIが補完して描き足す。 構図を崩さず背景を拡張できる。
バリエーション生成 1枚の画像から複数パターンを生成。 似たテイストの候補を比較検討できる。
品質・設定 アスペクト比指定 1:1、16:9、9:16などを指定可能。 YouTubeサムネやSNS用画像に最適。
HD / Standard 生成精度を用途に応じて選択。 高品質重視 or 速度・コスト重視を切替。
安全性 コンテンツ・モデレーション 不適切・権利侵害表現を自動制御。 企業利用でも安心して活用可能。

DALL·Eの料金プラン(2025年12月現在)

OpenAIの画像生成AI「DALL·E(ダリ)」の料金プランは、主にChatGPT経由で利用する場合と、開発者向けAPIとして利用する場合の2パターンがあります。

現在、無料版のChatGPTユーザーでも、DALL·E 3で画像生成が可能になっています。ただし 1日あたり生成できる画像数に制限があります。

また、Microsoft Designer (旧Bing Image Creator)ではMicrosoftがOpenAIと提携しているため、Microsoftアカウントがあれば無料でDALL·E 3を利用可能です。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://chatgpt.com/ja-JP/pricing/

プラン名 料金(月額) 画像生成の制限(目安)
Free(無料) $0 1日あたり2〜3枚程度。
混雑状況により変動します。
Plus $20 3時間ごとに80枚程度。
高画質・高優先度で生成可能。
Pro $200 無制限に近い利用が可能。
最上位モデル(o1-pro等)による高品質生成。
Team / Ent. $25〜 組織内での共有利用向け。
高い制限緩和とデータ保護に対応。

Stable Diffusion

Stable Diffusion(ステーブル・ディフュージョン)は、イギリスのStability AI社が中心となって開発した、オープンソースの画像生成AIです。

MidjourneyやDALL·Eとの最大の違いは、AIを動かすための「設計図(モデル)」が一般に公開されており、誰でも自分のPC(ローカル環境)にインストールして無料で使えるという点にあります。

最大の特徴は、自分のPCで動かす場合、月額料金や生成枚数の制限がありません(※高性能なGPUを搭載したPCが必要です)。

また、プライバシーの観点からも自分のPC内で画像が生成されるため、生成した画像を他人の目に触れさせることなく作成できます。自由度が高くローカル環境での使用に最適です

Stable Diffusionの主な機能

Stable Diffusionは、2025年現在、最新の「Stable Diffusion 3.5 (SD3.5)」シリーズが主力となっており、他のAIサービスと異なり「自分のPC(ローカル環境)で動かせる」という点が最大の特徴です。

カテゴリ 機能名 解説 メリット・活用例
生成モデル SD 3.5 Large 80億パラメータを持つ最強モデル。高精細な画像生成が可能。 プロ向け広告、出版物、高解像度アート制作。
SD 3.5 Medium 家庭用PCでも動作するよう最適化された25億パラメータモデル。 一般的なPCでの快適な画像生成、個人の創作活動。
SD 3.5 Large Turbo わずか4ステップで画像生成できる超高速モデル。 リアルタイムに近い速度での試行錯誤や大量生成。
高度な制御 ControlNet 画像の骨組み・輪郭・ポーズを指定して生成を制御。 手書きラフからの清書、指定ポーズでのキャラ生成。
LoRA / 微調整 追加学習データ(LoRA)を読み込み、特定の画風やキャラを再現。 「特定の絵師風」「特定の製品」を正確に描写。
Inpainting / Outpainting 画像の一部を書き換えたり、外側を自然に描き足す機能。 服装変更、写真背景の左右拡張など柔軟な編集。
インターフェース WebUI (A1111) ブラウザ上でパラメータを細かく調整できる定番UI。 設定を煮詰めて、こだわりの1枚を作り込む。
ComfyUI ノード形式で処理を接続し、複雑なワークフローを構築。 複数AI処理を組み合わせた高度な自動生成パイプライン。
新技術 (2025) Stable Video 4D 静止画や短い動画から、4視点を持つ立体動画を生成。 3Dモデルのような空間把握が可能な映像表現。
Real-time Rendering StreamDiffusion技術により、描いた瞬間から画像が変化。 デジタルペイント中のリアルタイム清書・色塗り支援。

推奨PCスペック

Stable Diffusionは、PCの「グラフィックボード(GPU)」の性能をフルに使います。特に、画像生成の処理を行うための専用メモリ(VRAM)の容量が重要です。下記に最低限必要なPCスペックをまとめていますので参考にしてください。

パーツ 推奨スペック 理由
GPU NVIDIA製 GeForce RTX シリーズ NVIDIA以外のGPU(MacのMシリーズを除く)は導入難易度が非常に高いため、NVIDIA一択です。
VRAM 8GB以上(最低4GB〜) 容量が多いほど、大きな画像や複雑な学習がスムーズになります。理想は12GB以上です。
メモリ(RAM) 16GB以上 PC全体の動作を安定させるために必要です。
ストレージ SSD 空き50GB以上 生成モデル(1つ数GB)を複数ダウンロードするため、余裕が必要です。

Leonardo.ai

画像出典:Leonardo.ai公式サイト https://leonardo.ai/

公式リンク: https://leonardo.ai/

Leonardo.ai(レオナルドAI)は、画像生成AIの中でも「多機能さ」と「無料枠の多さ」で非常に人気の高いプラットフォームです。

現在はCanva傘下となり、さらにクリエイティブツールとしての進化を加速させています。

「毎日少しずつ、いろんなモデルで絵を作りたい」という方には、最もコストパフォーマンスの良い選択肢です。

Leonardo.aiの主な機能

Leonardo.aiの主な機能は、独自の高品質モデル「Phoenix」や「Lucid Origin」を軸に、リアルタイム編集や動画生成まで多岐にわたります。2025年現在はCanvaの技術も統合され、より直感的な操作が可能になっています。

カテゴリ 機能名 解説 メリット・活用例
画像生成 Phoenix / Lucid Origin 2025年登場の次世代基盤モデル。プロンプトへの忠実度が極めて高い。 複雑な指示でも、意図通りの構図やディテールを正確に再現。
Elements (LoRA) 特定のスタイル(着物、サイバーパンク等)を画像に上乗せする機能。 モデルを変えずに、画風や質感を一貫して適用可能。
Transparent PNG 背景が最初から透過された状態の画像を生成。 切り抜き不要で、Webデザインや資料に即利用。
リアルタイム・編集 Live Canvas 手書きスケッチや図形に合わせて、AIがリアルタイム描画。 構図や配色を自分で制御しながら理想の絵を完成。
Canvas Editor 画像の消去・拡張・加工を一つの編集画面で実行。 不要物の除去や、写真外側の描き足し(アウトペイント)。
Magic Eraser 不要なオブジェクトをなぞるだけで自然に消去。 写真内の人物や看板を違和感なく削除。
高度な制御 Image Guidance 参照画像のポーズ・構図・奥行きなどを個別指定して反映。 手元の写真と同じポーズで別キャラを生成。
Prompt Enhance 短いキーワードから、AIが詳細なプロンプトを自動生成。 「美しい風景」だけでプロ級の指示文に変換。
動画・3D Motion 静止画に動きの強さを指定し、数秒の動画に変換。 キャラクターを動かしたり、風景に躍動感を追加。
3D Texture 3Dモデル用の高品質テクスチャをテキストから生成。 ゲーム制作や3DCGでオリジナル質感を即作成。

Leonardo.aiの料金プラン(2025年12月現在)

Leonardo.aiの料金プランは、「トークン(クレジット)制」を採用しており、2025年現在、個人向けからチーム向けまで幅広く展開されています。

多くのAIが「累計○枚まで無料」なのに対し、Leonardoは「毎日150トークン」が補充されるため、毎日少しずつ使う分にはずっと無料で使い続けられます。

「毎日少しずつ使いたい」のであれば無料版で十分ですが、「仕事で使う画像を非公開で作りたい」のであればApprenticeプランが推奨されます。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://leonardo.ai/pricing/

画像出典:Leonardo.ai公式サイト https://leonardo.ai/pricing/

プログラミング・開発支援に使えるAI

開発支援AIは、コーディングやコード理解の負担を減らし、開発スピードを向上させます。単なる自動補完だけでなく、コードの意図を理解する用途でも活用されています。専門分野ですが、初心者向けの簡単なプログラミング学習に使うのも◎。

GitHub Copilot

画像出典:Github公式サイト https://github.com/features/copilot


GitHub Copilot(ギットハブ・コパイロット)は、GitHubとOpenAIが共同開発した「AIペアプログラマー」です。

エンジニアがコードを書く際、次に書くべきコードをリアルタイムで提案したり、自然言語での指示から複雑な関数を作成したりすることで、開発スピードが劇的に向上するでしょう。

コード補完(Completions)に強く、関数名や変数名を入力し始めると、文脈を読み取ってその後の数行から数十行のコードを自動的に提案してくれます。

コメントからの生成にも強く、「// ファイルを読み込んでJSONとして解析する関数」のように日本語や英語でコメントを書くだけで、その処理を実行するコードを書き上げてくれます。

Copilot Chatでは、エディタ上でAIと直接チャットができます。「このコードのバグを見つけて」「この処理をリファクタリングして」「単体テストを作成して」といった依頼が可能です。

多言語・多環境に対応しています。Python, JavaScript, TypeScript, Ruby, Go, Javaなど主要なプログラミング言語に対応しており、VS Code, Visual Studio, JetBrains, Neovimなどの主要エディタで動作します。

コード補完特化で開発スピードの向上が期待できるAIです。

GitHub Copilotの主な機能

GitHub Copilotは、2024年から2025年にかけて「単なるコード補完ツール」から、開発工程のすべてをAIがサポートする「AIエージェント・プラットフォーム」へと劇的な進化を遂げています。それに伴い機能面も強化されています。

カテゴリ 機能名 解説 メリット・活用例
コーディング支援 インライン補完 エディタ上で次に書くべきコードをリアルタイムに提案。 ボイラープレートコードや定型処理の爆速実装。
マルチモデル選択 GPT-5.2、Claude 3.7 Sonnet、Gemini 3 Flashなどから選択可能。 「論理重視ならGPT」「自然な記述ならClaude」と使い分け。
対話・エージェント Copilot Chat 自然言語でコードの解説、バグ修正、テスト生成を依頼。 複雑な正規表現の作成や、レガシーコードの解読。
Coding Agent ファイルを跨いだ修正や、機能の実装を自律的に行うエージェント。 「〇〇機能を実装して」という指示で複数ファイルを一括更新。
開発プラットフォーム Copilot Workspace Issue(課題)から、計画立案・コード実装・PR作成までを完結。 要件定義からコードの土台作りまでをブラウザ上で自動化。
Copilot Extensions 外部ツール(Jira、Datadog等)と連携し、AIが情報を取得。 「Datadogのエラーログを基に修正案を出して」などの外部連携。
管理・セキュリティ Copilot Code Review プルリクエスト(PR)に対してAIが自動でレビューと修正案を提示。 コード品質の維持と、人間によるレビュー時間の削減。
Knowledge Bases 自社ドキュメントやリポジトリをAIに学習(インデックス)させる。 「自社独自フレームワークに従った書き方」をAIが学習。
Copilot Spark 自然言語だけでプロトタイプアプリを作成・デプロイ。 アイデアを即座に動くアプリとして形にする。

GitHub Copilotの料金プラン(2025年12月現在)

GitHub Copilotは、フリープランから始まり、個人向けから法人向けまで複数のプランが用意されています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ:https://github.com/features/copilot/plans?locale=ja

画像出典:Github公式サイト https://github.com/features/copilot/plans?locale=ja

Cursor

画像出典:cursor公式サイト https://cursor.com/ja


Cursor(カーソル)は、「AIとの対話」を前提にゼロから設計された次世代のコードエディタです。

世界中で爆発的に普及している「Visual Studio Code (VS Code)」をベースに開発されており、VS Codeの使い心地はそのままに、より強力で直感的なAI支援機能が最初から統合されているのが最大の特徴です。

自分のプロジェクト内の全ファイルをAIが読み込み、関連するコードを考慮した回答を行います。「このプロジェクトの認証フローを教えて」といった質問が可能です。

Composer (Agentモード)では、「ログイン画面を作って」と指示するだけで、複数のファイルにわたる新規作成や修正をAIが自動で行います。

GPT-4oだけでなく、現在コーディング能力で非常に評価の高いClaude 3.5 Sonnetや、推論に特化したo1などを自由に切り替えて使用できます。

VS Codeをベースにしているため、既存の拡張機能やショートカットを1クリックでそのまま引き継げます。

マルチモーダル対応で、スクリーンショット(画像)をチャット欄に貼り付けて、「このデザイン通りのUIを作って」「このエラー画面を直して」と指示することも可能です。

AI統合エディタでプロジェクト全体を理解して補助してくれます。

Cursorの主な機能

単なるコード補完を超え、コードベース全体を理解した「自律型エージェント」としての機能が中心となっています。

カテゴリ 機能名 解説 メリット・活用例
高度な補完 Cursor Tab 次に書くべきコードだけでなく、次に移動すべき場所まで予測。 複数行の一括生成、import文の自動追加、次の編集位置への自動ジャンプ。
対話型編集 Composer (Cmd I) 複数のファイルにまたがる修正を、対話形式で一括実行。 「ログイン機能を実装して」という指示で、フロントとバックの両方を修正。
Inline Edit (Cmd K) 選択したコード範囲に対して、プロンプトで直接修正を指示。 「このループをmap関数に書き換えて」「型定義を追加して」といった局所的な修正。
コードベース理解 Codebase Indexing プロジェクト全体をAIがインデックス化して把握。 「このプロジェクトの認証フローはどうなってる?」といった全体像の質問。
@ Mentions @Filesや@Docsで、特定のファイルや外部ドキュメントを参照。 最新の公式リファレンスを読み込ませながら、正しい構文でコーディング。
自律型支援 Agent Mode AIが「思考 → 実行 → エラー確認」を自律的に繰り返すモード。 「バグを見つけて直して、テストまで実行して」といった複雑なタスクの完結。
Bugbot コード内の潜在的なバグを自動検知し、修正案をワンクリックで提示。 デバッグ作業の時間を大幅に短縮し、コードの品質を担保。
カスタマイズ Rules (.cursorrules) プロジェクト固有の命名規則や実装ルールをAIに学習。 「関数は必ずアロー関数で書く」など、チーム規約をAIに遵守させる。
Model Selector Claude 3.7 / GPT-5.2 / Gemini 3など最新モデルを自由に切替。 「高度な設計はClaude、速度重視ならFlash」といった状況別の使い分け。

Cursorの料金プラン(2025年12月現在)

Cursor(カーソル)の料金プランは、2025年6月の大幅な改定を経て、従来の「回数制」から、より柔軟な「使用量ベース」や「特定の制限撤廃」が行われた体系に移行しています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://cursor.com/ja/pricing

画像出典:cursor公式サイト https://cursor.com/ja/pricing




動画・音声生成に使えるAI

動画・音声生成AIは、専門知識がなくても高品質なコンテンツを作れるのが特徴です。SNSやYouTubeなど、用途によって求められる機能は異なります。まずはフリープランで試してみて検討するのもアリだと思います。

Runway

画像出典:Runway公式サイト https://runwayml.com/

公式リンク: https://runwayml.com/

Runway(ランウェイ)は、アメリカのRunway AI, Inc.が開発・提供する、動画生成AIプラットフォームです。

単なる「動画を作るAI」にとどまらず、映画制作やクリエイティブワークフローを劇的に効率化する30種類以上のAIツールを提供しています。

複雑な操作を必要とせず直感的に動画を生成できるAIです。

Runwayの最大の特徴は、独自の動画生成モデルです。

Gen-3 Alpha / Alpha Turbo

Gen-3 Alpha / Alpha Turboは、2024年に登場した最新モデルです。実写と見分けがつかないほどのフォトリアルな質感、物理法則に則った自然な動き、そして指示に対する極めて高い忠実度が特徴です。

Gen-2

Gen-3 Alpha / Alpha Turbo以前の主力モデル。テキストや画像から動画を生成する草分け的存在で、現在も特定の演出(カメラ制御など)で広く使われています。

Runwayの主な機能

Runwayは、2024年から2025年にかけて、最新モデルGen-3 Alphaおよび最新のGen-4.5へのアップデートにより、実写と見紛うほどの超高品質な動画生成が可能になりました。

カテゴリ 機能名 解説 メリット・活用例
動画生成モデル Gen-4.5 (最新) 2025年12月発表。描写力と指示の再現性が飛躍的に向上した最新フラッグシップ。 プロの映画制作や広告など、ディテールが重要な映像制作。
Gen-3 Alpha 物理法則の理解、滑らかな動き、人物の表情に強い主力モデル。 非常にリアルな人物の動作や自然現象の再現。
Turbo モデル 画質を維持しつつ、生成速度を数倍に高速化したモデル。 試行錯誤を繰り返すスピーディーな制作ワークフロー。
コントロール機能 Motion Brush 静止画の中の「動かしたい部分」をなぞるだけで、そこだけを動かす。 滝の水だけを流す、髪をなびかせるなどの局所アニメーション。
Advanced Camera ズーム、パン、チルト、ロールなどのカメラワークを数値指定。 ドローン撮影のようなダイナミックな視点移動。
Director Mode 画面内の動きの強さや方向を、直感的なスライダーで調整。 映像のスピード感や迫力を細かく制御。
編集・マジックツール Magic Eraser (Video) 動画内の不要な人物や物体を選択するだけで自然に消去。 撮影時に映り込んだ通行人や看板を後処理で削除。
Lip Sync キャラクター画像に音声を読み込ませ、口の動きを自動同期。 多言語吹き替えや、静止画キャラクターを喋らせる表現。
Gen-4.5 Style Control 映画風、アニメ風、粘土細工風など画風を詳細に指定。 トーンを統一したシリーズ映像やブランド動画制作。

Runwayの料金プラン(2025年12月現在)

Runwayは「クレジット制」を採用しており、生成するごとにクレジットを消費します。

商用利用は、有料プラン(Standard以上)を契約していれば、生成した動画の商用利用が認められています。フリープランは動画に透かしが入り、商用利用もできません。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://runwayml.com/pricing

画像出典:Runway公式サイト https://runwayml.com/pricing

SORA(ソラ)

画像出典:Sora公式サイト https://sora.chatgpt.com/

公式リンク: https://sora.chatgpt.com/

OpenAIが開発した動画生成AI「Sora(ソラ)」は、2025年後半に一般公開が開始され、現在は誰でも利用可能なツールとなっています。

OpenAIとウォルト・ディズニー・カンパニーが歴史的な合意を発表しました。これにより、Soraを通じてディズニーの公認キャラクターやスタイルを安全かつ公式に利用できるワークフローがクリエイター向けに提供され始めています。

現在はWeb版(sora.com)だけでなく、iOSアプリもリリースされています。TikTokのような縦型フィードで他人の生成動画を閲覧したり、リミックス(他人の指示を流用して生成)したりするソーシャル機能が統合されています。

撮影機材なしで、実写映画のようなショート動画を作成したり、予算を抑えつつ、インパクトのあるイメージ映像を自社で制作したい人におすすめです。

Soraの主な機能

2025年12月現在、最新モデル「Sora 2」の導入で動画生成AIの常識を塗り替える機能が提供されています。

カテゴリ 機能名 2025年現在の状況・解説
動画生成 Sora 2 モデル 物理法則の再現性が劇的に向上。
重力、液体の動き、衝突などが極めて自然に表現可能。
最大解像度・長さ 1080p(フルHD)、最長20秒(Proプラン)までの
高品質動画生成に対応。
大型提携 ディズニー公認 2025年12月に提携発表。
ミッキー、マーベル、スター・ウォーズなど
200以上の公式キャラクターが利用可能に。
マルチモーダル Audio Generation 映像に合わせて
同期した音声・効果音・対話
AIが自動生成。
Image-to-Video 1枚の写真やキャラクターデザイン画から、
破綻の少ない動画を生成。
編集・機能 ストーリーボード テキストで「物語の流れ」を指定し、
一貫性のある複数シーンを作成。
iOSアプリ PCだけでなく、
スマホアプリからも動画生成・編集・共有が可能。
安全性 C2PA / ウォーターマーク AI生成物であることを示すメタデータを埋め込み、
偽情報の拡散を防止。

Soraの料金プラン(2025年12月現在)

Soraは単体ではなく、ChatGPTの有料プランの一部として、または専用の「sora.com」プランとして提供されています。

ChatGPT Plus / Business ($20~$25/月)

最大720pの解像度。
月間500本程度の生成制限あり。

ChatGPT Pro ($200/月)

無制限の生成(リラックスモード含む)。
最高画質1080p、透かし(ウォーターマーク)なしでのダウンロードが可能。

ElevenLabs

画像出典:ElevenLabs公式サイト https://elevenlabs.io/ja/

ElevenLabs(イレブンラボ)は、アメリカのElevenLabs社が提供する「世界で最も自然なAI音声」を目指して開発されている音声生成AIプラットフォームです。

単なる機械的な読み上げではなく、驚くほど人間味のある感情や抑揚を再現できるのが最大の特徴です。

誰でも簡単に高品質な音声生成が可能です。

2025年現在、日本市場へも本格展開しており、日本語の精度も極めて高くなっています。

ElevenLabsの主な機能

2025年現在、最新のV3エンジンの導入により、単なる読み上げを超え、感情表現や音楽生成までカバーする機能が搭載されています。
/* 機能一覧テーブル(コンパクト版・共通CSS) */

カテゴリ 機能名 解説 メリット・活用例
音声生成 Text to Speech (V3) 30言語以上に対応。句読点や文脈から感情や抑揚を自動調整。 動画ナレーション、オーディオブック、ポッドキャスト制作。
Speech to Speech 話し方のニュアンス(感情・リズム)を保ったまま別の声に変換。 演技力を維持したまま老若男女のキャラボイスを作成。
クローニング Instant Cloning 約1分の音声サンプルから、本人の声を数秒で再現。 クリエイターが自分の声で多言語コンテンツを量産。
Professional Cloning 数時間の高品質音声データを用い、本人と区別困難な精度で複製。 声優・著名人の声をデジタル資産として保存・ライセンス化。
翻訳・多言語 AI Dubbing 元の声質を保ったまま、動画音声を多言語に吹き替え。 YouTubeの世界配信、海外向けプレゼン資料作成。
Dubbing Studio 翻訳内容や発話タイミングをタイムライン上で細かく編集。 映像と音声の同期を完璧に仕上げるプロ向け制作。
新領域 (2025) Eleven Music テキストプロンプトから歌・BGM・ジングルを自動生成。 動画BGM制作やオリジナルボーカル曲の生成。
Sound Effects (SFX) 爆発音や環境音など、効果音をテキストから生成。 ゲーム制作・映像編集用の音素材を即調達。
Conversational AI 超低遅延でリアルタイムな双方向音声対話を実現。 AIコールセンター、英会話講師、ゲームNPC対話。

ElevenLabsの料金プラン(2025年12月現在)

ElevenLabsは、消費する「文字数(クレジット)」に応じた月額サブスクリプション制です。フリープランでは商用利用不可でクレジット表記が必要です。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://elevenlabs.io/ja/pricing

画像出典:ElevenLabs公式サイト https://elevenlabs.io/ja/pricing

業務効率化・資料作成に使えるAI

Notion AI

画像出典:Notion AI公式サイト https://www.notion.com/ja/help/guides/category/ai

公式リンク: https://www.notion.com/

Notion AIは、ドキュメント管理・タスク管理ツールである「Notion」に直接組み込まれたAIアシスタントです。

2024年から2025年にかけて大幅なアップデートが行われ、単なる文章作成補助から、ワークスペース全体を縦横無尽に動く「AIエージェント」へと進化しました。

他のAIチャットツールと異なり、「自分のデータ(Notion内のページや外部連携ツール)」を深く理解しているのが強みです。

議事録・要約・タスク整理を自動化するのに便利なAIです。

Notion AIの主な機能

Notion AIの主な機能は、2024年から2025年にかけて「文章のアシスタント」から、外部アプリの情報も横断して処理する「自律型AIエージェント」へと劇的な進化を遂げています。

カテゴリ 機能名 解説 メリット・活用例
AIエージェント AIコネクタ Slack、Google Drive、GitHubなど外部ツールと連携し、情報を横断取得。 「Slackでの議論を基に報告書を書いて」といったツール横断型の指示が可能。
自動実行タスク ページ作成・DB更新・通知送信など複数ステップを自動化。 議事録作成後、未完了タスクを自動でデータベースへ登録。
検索・Q&A エンタープライズサーチ ワークスペースや外部連携ツールから、答えと根拠(ソース)を提示。 「プロジェクトAの進捗と課題は?」と聞くだけで関連資料を要約。
AIパーソナライズ ユーザーの過去の文章や日記を学習し、出力を最適化。 自分の文体を再現したメール作成や、過去ログの自動整理。
ライティング 文章の作成・リライト ブログ、メール、プレスリリースなどの下書きや構成案を生成。 箇条書きを自然でプロ品質の文章に変換、トーン変更も簡単。
多言語翻訳 英語・中国語など14以上の言語に対応し、書式を保ったまま翻訳。 海外資料を見出し・表を崩さずそのまま翻訳可能。
分析・整理 自動要約 長文の議事録、PDF、画像(OCR)から重要ポイントを抽出。 20ページの資料を数行で把握し、意思決定を高速化。
AI Formula(関数) 自然言語の指示から、データベース用の複雑な関数を自動生成。 「期限が1週間以内のタスクに警告を出す関数を作って」と指示するだけ。

Notion AIの料金プラン(2025年12月現在)

2025年5月の改定により、料金体系が変更されました。無料枠が「累計20回」と非常に少なく、本格利用には有料プランが必須となっています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://www.notion.com/ja/pricing

画像出典:Notion AI公式サイト https://www.notion.com/ja/pricing

Microsoft Copilot

画像出典:Microsoft copilot公式サイト https://copilot.microsoft.com/

公式リンク: https://copilot.microsoft.com/

Microsoft Copilot(マイクロソフト・コパイロット)は、OpenAI社のGPT-4などの最新AI技術を、WindowsやOffice製品、さらにはビジネスデータと統合した「日常業務を支援するAIアシスタント」です。

2024年から2025年にかけて大幅な進化を遂げ、単なるチャットツールから、自律的にタスクをこなす「エージェント」へと変貌しています。

Officeアプリとの統合により、Wordでの文書作成、Excelでのデータ分析(関数の作成や可視化)、PowerPointのスライド自動生成などをAIが行います。

従って、Officeアプリを日常的に利用している人にとって強い味方になるAIです。

Office製品と連携して業務効率化を期待できます。

Microsoft Copilotの主な機能

Microsoft Copilotは、2025年12月現在、最新の「GPT-5(一部)」や「o1」系の推論モデル、自律型エージェント機能が導入され、実務の自動化が劇的に進んでいます。

カテゴリ 機能名 解説 メリット・活用例
オフィス連携 Copilot in Excel 自然言語によるデータ分析、複雑な関数作成、グラフ生成を自動化。 「前月比の成長率を計算して」と指示するだけで即座に集計・可視化。
Copilot in Word 文書のドラフト作成、要約、トーン変換、校正を支援。 箇条書きメモから、正式な報告書や提案書を一気に作成。
Copilot in PowerPoint テキストやWord文書から、スライド構成とデザインを自動生成。 1枚の構成案から、画像付きプレゼン資料を数分で完成。
会議・通信 Copilot in Teams 会議内容のリアルタイム要約、未解決事項の抽出、発言整理。 途中参加しても「これまでの議論の流れ」を即座に把握。
Copilot in Outlook 長文メールスレッドの要約、返信文の下書き、予定調整を支援。 溜まったメールを要約で把握し、適切な返信案をワンクリック生成。
高度な検索・自動化 Copilot Search / Pages Web情報と社内データを横断検索し、結果を「ページ」として整理。 複数資料をまとめてリサーチし、そのまま共有用ドキュメント化。
Agent 365(エージェント) 採用・発注管理など、特定業務を自律的に実行する専用AI。 新入社員オンボーディングなど、複雑な業務フローを自動化。
Copilot Studio ノーコードで、自社専用のAIエージェントを構築できる開発環境。 社内規定やマニュアルだけを学習した「社内QA専用AI」を作成。
マルチモーダル Copilot Voice / Vision 音声での自然な対話や、画面・画像をAIが見て理解する機能。 スマホで撮影したエラー画面を見せて、原因と解決策を相談。

Microsoft Copilotの料金プラン(2025年12月現在)

利用シーンに合わせて大きく3つの段階に分かれています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://www.microsoft.com/ja-jp/microsoft-365-copilot/pricing

画像出典:Microsoft copilot公式サイト https://www.microsoft.com/ja-jp/microsoft-365-copilot/pricing




マーケティング・SNS運用に使えるAI

Canva AI

CanvaのAI機能は、「Magic Studio(マジックスタジオ)」という名称で、デザイン作成のあらゆる工程に統合されています。

Canvaのエディタ内に25種類以上のAIツールが組み込まれています。

写真加工のためにAdobe、動画のためにRunway、文章のためにChatGPT…と使い分ける必要がなく、「一つのキャンバス上ですべて完結する」のが最大の強みです。

AIで生成した素材を、Canvaが持つ数億点のプロ品質テンプレートにそのまま流し込めるため、デザインの仕上がりが非常に安定しています。

AIがなくとも、Canva自体が無料で充分にマーケティングやSNS運用での画像作成等に使えるのですが、エディタ内のAIツールを使うことで作業効率も上がります。

Canva AIの主な機能

Canva AIは、「マジックスタジオ (Magic Studio)」という名称で展開されており、2025年最新のアップデートにより、一括編集や高精度な画像生成(Dream Lab等)が追加されています。

カテゴリ 機能名 解説 メリット・活用例
自動デザイン マジックデザイン メディアをアップロードするか、言葉で指示するだけで
デザイン案を自動生成。
プレゼン資料やSNS投稿の土台を数秒で完成させる。
マジック一括編集 文言違いやサイズ違いの大量の画像を、
一度にAIが生成・編集。
バナー広告のABテスト用素材や、
多言語展開の効率化。
画像生成・編集 Dream Lab 2025年登場。参照画像のスタイルを維持したまま、
新しい画像を生成。
ブランドのトーン&マナーに
完璧に合った画像素材の作成。
マジック加工 画像内の特定の場所を塗りつぶし、
プロンプトで別の物に置き換え。
モデルが持っているコーヒーを
「花束」に書き換える。
マジック消しゴム 不要なオブジェクトをなぞるだけで、
自然に消去。
写真に写り込んでしまった
通行人や電柱を消す。
背景除去 ワンクリックで被写体を切り抜き。
2025年版はより高精度。
商品写真の切り抜きや、
合成用素材の作成。
文章・翻訳 マジック作文 ブログの草稿、SNSのキャプション、
キャッチコピーを自動生成。
執筆時間の短縮や、
アイデア出しのパートナーとして活用。
AI翻訳 デザインのレイアウトを崩さず、
100以上の言語に自動翻訳。
1つのデザインから
グローバル展開用の多言語ポスターを作成。
動画・アニメ マジックメディア テキストから動画(数秒)を生成。
静止画を動かすことも可能。
SNS用の短い動画広告や、
動く背景素材の作成。
AIアバター(HeyGen等) 静止画の人物を、
テキストに合わせて喋らせる。
プレゼン動画のナレーターや、
教育用コンテンツの作成。

Canva AIの料金プラン(2025年12月現在)

Canvaは「クレジット制」に近い形をとっており、プランによってAIの利用回数が決まっています。

※料金プランは変更される場合がありますので、必ず公式サイトで確認するようにしてください。

公式サイト料金ページ: https://www.canva.com/ja_jp/pricing/

画像出典:Canva公式サイト https://www.canva.com/ja_jp/pricing/




各AIの商用利用について

全体的な傾向として、「有料プランであれば商用利用可能」というのが業界標準ですが、一部のツールでは無料版でも可能であったり、逆に権利がサービス側に属したりする場合があるため注意が必要です。

一覧表でまとめていますが、必ず各ツールの規約を読んで確認するようにしてください。

カテゴリ サービス名 商用利用の可否 2025年12月時点の特記事項・注意点
テキスト・総合 ChatGPT 可能 全プランで商用利用可能。
ただしビジネス機密の保持には
Team / Enterpriseの利用を強く推奨。
Claude 可能 生成物の権利はユーザーに帰属。
日本語の自然なライティングに定評。
Gemini 可能 Workspace版(有料)では、
入力データの学習除外が保証される。
Notion AI 可能 ワークスペース全体の情報を要約・整理して
作成した文書も商用利用可。
Microsoft Copilot 可能 M365版では、意図しない著作権侵害に対する
法的補償プログラムあり。
Perplexity 限定的 Proプランでも原則「非商用」。
ビジネス利用はEnterprise版が必須。
Grok (xAI) 可能 Xの有料プランで利用可。
X上の最新情報を反映した広告コピー等に有効。
動画・画像生成 Sora (OpenAI) 有料版のみ 【最新】ディズニー等の
200以上の公式キャラクターが利用可能に。
Midjourney 有料版のみ 年間売上100万ドル以上の企業は
Pro / Megaプラン契約が必須。
DALL·E 3 可能 ChatGPT内での生成物は販売可。
GPT-Image-1への移行も進行中。
Leonardo.ai 有料版のみ 無料版は権利がLeonardo側に帰属。
Apprentice以上で商用権取得。
Stable Diffusion 可能 SD 3.5は年間収益100万ドル未満なら
無料ライセンスで商用利用可。
Runway 有料版のみ Standard以上のプランで
生成物の商業的権利が認められる。
Canva AI 可能 デザイン全体の商用利用は可。
ただし素材そのものの再配布は禁止。
開発・音声 Cursor / Copilot 可能 生成コードの利用に制限なし。
企業プランではコードの秘匿性も高い。
ElevenLabs 有料版のみ 無料版は非商用かつクレジット必須。
Starter以上で商用権が発生。




AIを利用する際の注意点

AIは手軽に利用できる反面、注意すべき点がいくつかあります。

情報の正確性

AIの出力は必ずしも正確ではないため、公式情報で裏付けることが重要です。

その為には、ソース付きで出力してくれるAIを使うのがベスト。

正確性を求められるビジネス用途でAIを使う場合は、ファクトチェックや根拠を自分の目で確かめた上で利用してください。

著作権・商用利用

ツールごとに必ず利用規約を確認してください。

特に、画像や動画は商用利用に制限をかけているツールも珍しくありません。

AI依存を避ける

最終判断は人間が行うことが重要です。

1から10までAIに任せるのが習慣になると、思わぬミスやトラブルが発生してもおかしくありません。

そこはご自身の裁量でうまくAIと付き合うようにしてください。

よくある質問(FAQ)

無料で使えるAIはありますか?

本記事でご紹介した通り、多くのAIツールには無料プランや試用枠があります。

日本語対応していますか?

主要なAIツールは日本語に対応していますが、英語表記のAIも多く存在します。ブラウザの翻訳機能をうまく活用してください。

商用利用は可能ですか?

ツールによっては利用不可のものもあります。必ず公式規約を確認してください。


まとめ|用途に合ったAI選びが生産性を左右する

本記事でご紹介したAIの他にも、日々新しいAIがリリースされています。

同じ用途でもAIによって使い心地や作業効率の良さも変わってきます。

ほとんどのAIは無料で試せますので、ご自身に合ったAIを見つけてみてください。

  • このエントリーをはてなブックマークに追加
  • Pocket