2026/06/28

【IT初心者でも効率100倍】AI活用講座第2回：AIは「データ変換器」

レベル2。AIを“会話相手”から“データを入れたら別の形にして返す機械”へ。モデルごとの入力・出力と「変換の癖」を押さえ、表・文書・画像・形式変換の驚きの実例で一気にラクをする。

#AI活用講座 #生成AI

第1回では、AIを 「チャット相手」 として、話しかけて一緒に考える使い方を見ました。今回は発想を大きく切り替えます。AIを 「データ変換器」――つまり データを入れたら、別の形にして返してくる機械 とみなす段階です。

前回「次回でラクになる」と予告した、お詫びメールの作成や長い資料の要約も、まさにここ。手元のバラバラなデータを放り込むと、整った表・要点・別形式になって返ってくる。この“変換”の感覚をつかむと、毎日の作業が一気に短くなります。

大原則：AIは「入力 → 変換 → 出力」の機械

データ変換器としてのAIは、いつも同じ形をしています。

手元のデータ（入力）→ AIに変換させる → 欲しい形（出力）

しかも、入れるものも・出すものも何でもいい。手元のデータは、結局 テキスト・画像・音声/動画・ソフト専用データ（書類）の4種類 のどれか。AIは、そのどれを渡しても、欲しい別の形へ“横断的に”変換してくれます（この4種類の中身は、すぐ下の「データ形式の大枠」で説明します）。

flowchart LR
  A[テキスト] --> AI
  B[画像] --> AI
  C[音声・動画] --> AI
  D[ソフト専用データ] --> AI
  AI(("AI＝データ変換器"))
  AI --> S[テキスト]
  AI --> I[画像]
  AI --> M[音声・動画]
  AI --> F[ソフト専用データ]

ポイントは、手元のデータを“渡す”こと。チャット欄に文章を貼り付けるだけでなく、ファイルそのものを渡せます。

入力欄の 「＋」ボタン から添付、または ファイルをドラッグ＆ドロップ
画像なら コピー＆ペースト でもOK（スクリーンショットも貼れます）

📷 スクリーンショット（後で差し込み）：チャット入力欄の「＋」ボタンと、Excelファイルをドラッグして添付しているところ

データ形式の大枠 ― 結局、このどれか

ここから「PDF」「CSV」「JSON」といった言葉がたくさん出てきます。これらは データ形式――いわば データの“入れ物（拡張子）” のこと。種類が多くて混乱しがちですが、大きく分けるとたった4つ。この大枠さえ押さえれば、頭の中がスッと整理されます。

大枠（データの種類）	仲間の形式	ひとこと
テキスト（素の文字）	.txt / CSV / JSON / HTML / SVG / Markdown / Mermaid	メモ帳でも開ける“ただの文字”。AIと最も相性がよく、コピペでそのまま渡せる
画像	JPEG / PNG	写真や絵。中に写っている文字もAIは読める
音声・動画（メディア）	MP3 / MP4	音や映像。容量が大きい
ソフト専用データ	Word / Excel / PDF	専用ソフトで開く前提の書類（専門的には“バイナリ”）。ファイルとして添付して渡す

ぜんぶ覚える必要はありません。手元のデータを見て 「これはテキスト？　画像？　音声・動画？　それとも専用ソフトの書類？」 ――この4つのどれかをイメージできれば十分です。

中でも テキストが一番ラク。CSV や Markdown のように中身がただの文字の形式は、コピペで気軽に渡せてAIも扱いやすい。逆に ソフト専用データ（Word・Excel・PDF）は、ファイルを添付して渡すのが基本です。

そして、テキストの中の Markdown と Mermaid は、特に毛色が違う 「記法」。中身はただの文字なのに、対応した場所で開くと、整形された文章や図に化ける書き方です。Markdown は # や - で見出し・箇条書き・表を表す軽い記法で、実はこの記事も Markdown。Mermaid は文字でフローチャートなどを描く記法で、さきほどの「入力 → AI → 出力」の図もこれ。AI はこうした記法が得意なので、「Markdownで」「Mermaidで図にして」と頼めば、そのまま使える形で返ってきます。

実は「テキスト＝ただの文字」とあなどれません。記法を使えば、テキストだけで図・表・Webページまで表せます。これが、テキストがAIと相性抜群な理由です。

テキストで表せるもの	使う形式・記法	ひとこと
ふつうの文章	プレーンテキスト / Markdown	見出し・箇条書きで読みやすく
表	Markdownの表 / CSV	行と列のデータ
図・グラフ	Mermaid / SVG	フローチャート、アイコン、チャート
Webページ・ミニアプリ	HTML	ブラウザで開くページ

なぜ知っておくと有利なのか

形式がわかると、AIへの注文が 「次の作業でそのまま使える形」 でできるようになります。

出すとき：「結果は CSVで」「表（Excel）で」「図は SVGで」と頼めば、コピペや手直しなしで次に進めます。
渡すとき：表なら Excel/CSV、見た目を固定したいなら PDF、くっきりした図なら PNG/SVG…と、最初から扱いやすい形で渡せます。
変換の道筋が見える：「動画はそのままムリ → 文字起こし（テキスト）にすれば渡せる」のように、詰まったときの回り道が思いつきます。

つまり、データ形式を知っている人ほど、AIに正確に注文でき、出てきたものをそのまま使える。地味ですが、ここが効率の差になります。

でも、全部は覚えなくて大丈夫

ここまで読んで「多いな…」と思っても心配いりません。形式に迷ったら、「いい感じの形式で出して」「いちばん使いやすい形にして」と丸投げでOK。AIが場面に合った形式を選んでくれます。知っていれば自分で指定でき、知らなければAIに任せられる――どちらでも前に進めます。

モデルごとに「入れられるもの・出せるもの」が違う

ここが今回いちばん大事なところ。何を渡せて、何を出せるかはAIによって違います。といっても、見るべきは結局 さっきの4つの大枠のどれを扱えるか だけ。これを押さえれば「このデータはどのAIに持っていけばいいか」で迷わなくなります。

入れられるもの（入力）

さっきの4分類で見ると、こうなります。

データの種類	Claude	ChatGPT	Gemini
テキスト（.txt / CSV / Markdown など）	○	○	○
画像（写真・スクショ／中の文字も読める）	○	○	○
音声・動画	×	×	○
ソフト専用データ（Word / Excel / PDF）	○	○	○

ポイントは 音声・動画 の行。Claude と ChatGPT には基本そのまま渡せません。先に 文字起こししてテキストにしてから渡すのが定石です。一方 Gemini は音声・動画も直接読めるので、ここだけは例外として覚えておくと便利です。

出せるもの（出力）

出すほうも、入力とまったく同じ4分類で見られます。

出せるもの	Claude	ChatGPT	Gemini
テキスト（文章・表・コード／HTML・SVGの図解やWebページ）	○	○	○
画像（写真調）	×	○	○
音声・動画	×	×	×
ソフト専用データ（Word / Excel / PDF）	○	○	○

テキスト（文章・表）は3社とも得意。違いが出るのは画像です。Claude は写真のような画像を出力できません（読むのは得意ですが、描くのは不可）。写真調の画像なら ChatGPT か Gemini の出番。ただし Claude は Webページ作りが得意で、HTML/SVG による 図・グラフ・デザインを“描く”のはむしろ大の得意です。

ソフト専用データ（Word・Excel・PDF）は、いまは3社ともファイル作成機能で書き出せます。一方 音声・動画の“生成” だけは、LLM単体ではなく後で触れる 特化型AI の領域です。

あっと驚く変換の実例

ここからは実演です。どれも「データを渡して、変換を頼むだけ」。手作業だと何時間もかかることが、一瞬で片づきます。

表・数値の整形／集計

崩れたデータや Excel・CSV を渡して、整形・集計はもちろん、データの“掃除”まで任せられます。

（バラバラの売上メモを貼り付け、または Excel を添付して）
「日付・商品・金額」の表に整えて、商品ごとの合計と、売上トップ3も出してください。

驚くのはここから。手作業だと地獄の 重複・打ち間違いの修正 も一発です。（※顧客リストは個人情報。社外秘データを外部のAIに渡してよいか、会社のルールを確認してから）

（顧客リストの Excel を添付して）
重複している行と、表記ゆれ・全角半角の混在を見つけて、きれいに直した表にしてください。

なんと グラフの画像 からも数値を取り出せます。

（棒グラフの画像を添付して）このグラフの数値を読み取って、表にしてください。

📷 スクリーンショット（後で差し込み）：ぐちゃぐちゃのデータが、整った表＋集計になって返ってきた画面

文書の変換

長い文章を、欲しい形に“絞り出し”ます。ただ要約するだけではありません。（※契約書や規約などの機密文書は、外部AIで扱ってよい範囲かを確認してから渡しましょう）

（利用規約やPDFの契約書を添付して）
この契約で“こちらが不利になりうる点”を、重要度つきの表にまとめてください。

大量の声を一瞬で整理することもできます。

（アンケートの自由記述を100件分まとめて貼り付けて）
意見を5〜7個のカテゴリに分類し、それぞれの件数と代表的な声を表にしてください。

お詫びメールのような返信も、いきなり「書いて」ではなく これまでのやり取りを貼り付ける のがコツ。文脈を踏まえた、ちぐはぐにならない返信になります。

（取引先とのこれまでのメールのやり取りを貼り付けて）
この流れを踏まえて、納品が遅れることのお詫びの返信メールを書いてください。
・遅れる理由：部材の入荷遅延 ・新しい納期：6月30日 ・トーン：丁寧でかしこまりすぎない

メールの履歴のように 元データを渡してから変換させる ―― これがチャット相手との大きな違いです。

形式・メディア変換

ある形式から別の形式へ“翻訳”します。極めつけは、Gemini が動画も読めることを活かしたこれ。

（名刺を1枚ずつ見せるように撮った“パラパラ動画”を Gemini に添付して）
各名刺から、会社名・氏名・電話・メールを読み取って、一覧表にしてください。

動画をそのまま渡せるのは Gemini ならでは。専用の名刺アプリがいらなくなるレベルです。録音もまとめて変換できます。（※名刺は個人情報、録音も機密を含むことがあるので、扱いには注意を）

（会議の録音を Gemini に添付、または文字起こしを貼り付けて）
文字起こし → 議事録（決定事項）→ やることリスト（担当・期限）の順にまとめてください。

（PDFやスクショの表を添付して）そのままコピーして使えるテキストの表にしてください。

動くWebページ・ミニアプリを作る

“出力”の極めつけがこれ。プログラミングの知識がなくても、説明するだけで動くものが作れます。

お小遣い帳のかんたんなWebアプリを作ってください。
日付・項目・金額を入力すると、一覧に追加されて、合計が自動で出るようにしてください。

その場でプレビューが表示され、気に入らなければ「色を変えて」「合計を月ごとに」と会話で直せます。完成したらHTMLファイルとして保存も可能です。

📷 スクリーンショット（後で差し込み）：Claude のアーティファクトに、入力欄と合計が動くお小遣い帳アプリが表示された画面

そして、ここが Claude の隠れた得意技。Claude は写真調の画像こそ出せませんが、Webページの上で図やデザインを“描く”のはむしろ超得意です。HTML や SVG を使うので、インフォグラフィック・フローチャート・図解・チラシ風デザインなどがきれいに作れます。

（Claude で）次の内容を、矢印や囲みを使った見やすい図解（1枚のWebページ）にしてください。
（図にしたい内容を貼る）

「画像が出せない＝デザインが苦手」ではありません。作る土俵がラスター画像ではなくWebページなだけ。ここは ChatGPT・Gemini にはない Claude の強みです。

画像の加工・生成

ここまでは実用寄り。最後は、いちばん“映える”画像の加工・生成です。作るなら ChatGPT、直すなら Gemini が基本。

ChatGPT は、説明から一枚を生成。日本語の文字入れも得意になりました。

（ChatGPT で）「夏祭り 7/20 18時〜」という日本語を入れた、
夜店が並ぶお祭りの告知ポスター画像を作ってください。

Gemini（Nano Banana）は、手持ちの写真を編集。SNSでバズった “フィギュア化” もこれです。

（自分やペットの写真を Gemini に添付して）
この写真を、棚に飾れる1/7スケールのフィギュア風の画像にしてください。

（色あせた古い写真を添付して）自然な色をつけて、傷や色あせも修復してください。

手書きのラフを清書イラストに、商品写真の背景差し替えなども得意。もちろん 画像の中の文字を読む のも3社OKです。

（レシートや名刺の写真を添付して）書かれている文字を読み取って、表にしてください。

📷 スクリーンショット（後で差し込み）：1枚の写真が、フィギュア風の画像に変換された before / after

⚠️ ひとつだけ約束を。AIは数字や事実を 平気で間違えます。読み取った数値・集計・契約のリスクなど、大事なものは必ず自分でも確認してください。便利さと、鵜呑みにしないことはセットです。

変換の“癖”を知ると完璧

ひととおり見たところで、どのAIがどの変換を得意とするかを整理しておきましょう。ここまで押さえると一人前です。

画像をゼロから作る → ChatGPT：画像生成モデル Images 2.0（通称 gpt-image-2）が、説明から高品質な画像を一から生成するのが得意。日本語の文字入れも上手になりました。
元の画像を編集する → Gemini：画像モデル Nano Banana は、すでにある画像を直す・加工するのが得意。「この写真の背景だけ変えて」のような編集に強い。
文章を読む・整える／Webで“描く” → Claude：長い文書の要約や、自然な文章への整形が得意。写真のような画像は出せませんが、その代わり Webページ作りが得意。HTML や SVG を使って、図・グラフ・チャートやデザインを“描く”のはむしろ超得意です。
画像の中の文字を読む（OCR的な使い方）：3社ともOK。レシートやスクショ、手書きメモを撮って「文字に起こして」と頼めます。
説明するだけでWebページを作る：Claude の アーティファクト、ChatGPT・Gemini の Canvas を使うと、「○○できるページを作って」と頼むだけで、その場で動くWebページやミニアプリができ、プレビューまで見られます（特に Claude のアーティファクトが有名）。

💡 ざっくり言うと、作るなら ChatGPT、直すなら Gemini、整えるなら Claude。迷ったらこの3語を思い出してください。

コラム①：要望の抽象度（レベル2編）― 出力の「形」を指定する

第1回では「具体的に頼む」が基本でした。データ変換器では、そこに “出力の形”の指定 を足すと精度が跳ね上がります。

「Markdownの表で」「CSV形式で」「3列（日付・項目・金額）で」
「1行ずつ箇条書きで」「500字以内で」

「何を」だけでなく 「どんな形で返してほしいか」 を添える。これがレベル2の頼み方のコツです。

コラム②：どの形式で渡せばいい？はAIに聞く

「このファイル、そのまま渡して大丈夫？」と迷ったら、それ自体をAIに聞けばOKです。

手元に○○というデータがあります。あなたに渡すには、
どの形式（コピペ・PDF・Excel・画像など）が一番うまく扱えますか？

渡し方の正解もAIが教えてくれます。わからない形式のまま手を止めない――これが効率化のコツです。

ちょっと寄り道：LLMと「特化型AI」

ここまで使ってきた ChatGPT・Claude・Gemini は、まとめて LLM（大規模言語モデル） と呼ばれます。言葉を軸に、調べ物も変換も画像出力も“なんでも”こなす 汎用の何でも屋 です。

一方で世の中には、たった一つの仕事に全振りした AI があります。これを 特化型AI（専用AI・一芸特化AIとも）と呼びます。画像なら画像だけ、3Dなら3Dだけを、とことん極めたタイプです。

LLM と特化型AI の違い

	LLM（汎用・何でも屋）	特化型AI（一芸特化）
例	ChatGPT / Claude / Gemini	Midjourney / Sora / Suno / Meshy など
守備範囲	会話・文章・変換・画像…と広い	一つの出力（画像/動画/音楽/3D）に集中
手軽さ	話しかけるだけ。ついでに作れる	専用ツール。用語や操作はやや専門的
仕上がり	手早く“それなり”	作り込み・品質・細かい制御が段違い

ざっくり言うと、サッと一枚なら LLM、本気で作り込むなら特化型AI。役割が違うので、優劣ではなく使い分けです。

代表的な特化型AI（軽く紹介）

画像生成：Midjourney（圧倒的な画力）／Stable Diffusion（自由度が高くローカルでも動く）／Adobe Firefly（商用利用に安心）
動画生成：Sora 2（OpenAI）／Veo 3（Google）／Runway／Kling ―― テキストや画像から数秒の動画を生成
音楽・音声：Suno・Udio（数語でBGMや楽曲）／ElevenLabs（自然なナレーション）
3Dモデル生成：Meshy（3Dプリント向き）／Tripo（画像1枚から高速）／Rodin（人物・アバター）

💡 実は、LLM に「画像を作って」と頼むと、裏でこうした生成の仕組みが動いていることもあります。まずは LLM で気軽に試して、「もっと本気で作り込みたい」と思ったら特化型AIへ――という順番がおすすめです。

まだWebで完結する、その限界

ここまで、ぜんぶスマホ・パソコンのチャット画面の中で完結しています。それでも十分すごいのですが、限界もあります。

毎回、自分でコピペ・添付する手作業が残る
AIは 渡した分しか見えない。フォルダの中の何十個のファイルをまとめて、とはいかない

次回（第3回）は、ここを越えます。AIを 「現場監督」 とみなし、あなたのパソコンのファイルを直接見て・触ってもらう段階へ。コピペすら要らなくなります。

前の回：第1回：AIは「チャット相手」
次の回：第3回：AIは「現場監督」（公開準備中）

あなたは20歳以上ですか？

【IT初心者でも効率100倍】AI活用講座 第2回：AIは「データ変換器」