記事一覧へ
2026/06/28

【IT初心者でも効率100倍】AI活用講座 第2回:AIは「データ変換器」

レベル2。AIを“会話相手”から“データを入れたら別の形にして返す機械”へ。モデルごとの入力・出力と「変換の癖」を押さえ、表・文書・画像・形式変換の驚きの実例で一気にラクをする。

#AI活用講座 #生成AI

第1回では、AIを 「チャット相手」 として、話しかけて一緒に考える使い方を見ました。今回は発想を大きく切り替えます。AIを 「データ変換器」――つまり データを入れたら、別の形にして返してくる機械 とみなす段階です。

前回「次回でラクになる」と予告した、お詫びメールの作成や長い資料の要約も、まさにここ。手元のバラバラなデータを放り込むと、整った表・要点・別形式になって返ってくる。この“変換”の感覚をつかむと、毎日の作業が一気に短くなります。

大原則:AIは「入力 → 変換 → 出力」の機械

データ変換器としてのAIは、いつも同じ形をしています。

手元のデータ(入力)→ AIに変換させる → 欲しい形(出力)

しかも、入れるものも・出すものも何でもいい。手元のデータは、結局 テキスト・画像・音声/動画・ソフト専用データ(書類)の4種類 のどれか。AIは、そのどれを渡しても、欲しい別の形へ“横断的に”変換してくれます(この4種類の中身は、すぐ下の「データ形式の大枠」で説明します)。

flowchart LR
  A[テキスト] --> AI
  B[画像] --> AI
  C[音声・動画] --> AI
  D[ソフト専用データ] --> AI
  AI(("AI=データ変換器"))
  AI --> S[テキスト]
  AI --> I[画像]
  AI --> M[音声・動画]
  AI --> F[ソフト専用データ]

ポイントは、手元のデータを“渡す”こと。チャット欄に文章を貼り付けるだけでなく、ファイルそのものを渡せます

  • 入力欄の 「+」ボタン から添付、または ファイルをドラッグ&ドロップ
  • 画像なら コピー&ペースト でもOK(スクリーンショットも貼れます)

📷 スクリーンショット(後で差し込み):チャット入力欄の「+」ボタンと、Excelファイルをドラッグして添付しているところ

データ形式の大枠 ― 結局、このどれか

ここから「PDF」「CSV」「JSON」といった言葉がたくさん出てきます。これらは データ形式――いわば データの“入れ物(拡張子)” のこと。種類が多くて混乱しがちですが、大きく分けるとたった4つ。この大枠さえ押さえれば、頭の中がスッと整理されます。

大枠(データの種類)仲間の形式ひとこと
テキスト(素の文字).txt / CSV / JSON / HTML / SVG / Markdown / Mermaidメモ帳でも開ける“ただの文字”。AIと最も相性がよく、コピペでそのまま渡せる
画像JPEG / PNG写真や絵。中に写っている文字もAIは読める
音声・動画(メディア)MP3 / MP4音や映像。容量が大きい
ソフト専用データWord / Excel / PDF専用ソフトで開く前提の書類(専門的には“バイナリ”)。ファイルとして添付して渡す

ぜんぶ覚える必要はありません。手元のデータを見て 「これはテキスト? 画像? 音声・動画? それとも専用ソフトの書類?」 ――この4つのどれかをイメージできれば十分です。

中でも テキストが一番ラク。CSV や Markdown のように中身がただの文字の形式は、コピペで気軽に渡せてAIも扱いやすい。逆に ソフト専用データ(Word・Excel・PDF)は、ファイルを添付して渡すのが基本です。

そして、テキストの中の MarkdownMermaid は、特に毛色が違う 「記法」。中身はただの文字なのに、対応した場所で開くと、整形された文章や図に化ける書き方です。Markdown は #- で見出し・箇条書き・表を表す軽い記法で、実はこの記事も Markdown。Mermaid は文字でフローチャートなどを描く記法で、さきほどの「入力 → AI → 出力」の図もこれ。AI はこうした記法が得意なので、「Markdownで」「Mermaidで図にして」と頼めば、そのまま使える形で返ってきます。

実は「テキスト=ただの文字」とあなどれません。記法を使えば、テキストだけで図・表・Webページまで表せます。これが、テキストがAIと相性抜群な理由です。

テキストで表せるもの使う形式・記法ひとこと
ふつうの文章プレーンテキスト / Markdown見出し・箇条書きで読みやすく
Markdownの表 / CSV行と列のデータ
図・グラフMermaid / SVGフローチャート、アイコン、チャート
Webページ・ミニアプリHTMLブラウザで開くページ

なぜ知っておくと有利なのか

形式がわかると、AIへの注文が 「次の作業でそのまま使える形」 でできるようになります。

  • 出すとき:「結果は CSVで」「表(Excel)で」「図は SVGで」と頼めば、コピペや手直しなしで次に進めます。
  • 渡すとき:表なら Excel/CSV、見た目を固定したいなら PDF、くっきりした図なら PNG/SVG…と、最初から扱いやすい形で渡せます。
  • 変換の道筋が見える:「動画はそのままムリ → 文字起こし(テキスト)にすれば渡せる」のように、詰まったときの回り道が思いつきます。

つまり、データ形式を知っている人ほど、AIに正確に注文でき、出てきたものをそのまま使える。地味ですが、ここが効率の差になります。

でも、全部は覚えなくて大丈夫

ここまで読んで「多いな…」と思っても心配いりません。形式に迷ったら、「いい感じの形式で出して」「いちばん使いやすい形にして」と丸投げでOK。AIが場面に合った形式を選んでくれます。知っていれば自分で指定でき、知らなければAIに任せられる――どちらでも前に進めます。

モデルごとに「入れられるもの・出せるもの」が違う

ここが今回いちばん大事なところ。何を渡せて、何を出せるかはAIによって違います。といっても、見るべきは結局 さっきの4つの大枠のどれを扱えるか だけ。これを押さえれば「このデータはどのAIに持っていけばいいか」で迷わなくなります。

入れられるもの(入力)

さっきの4分類で見ると、こうなります。

データの種類ClaudeChatGPTGemini
テキスト(.txt / CSV / Markdown など)
画像(写真・スクショ/中の文字も読める
音声・動画××
ソフト専用データ(Word / Excel / PDF)

ポイントは 音声・動画 の行。Claude と ChatGPT には基本そのまま渡せません。先に 文字起こししてテキストにしてから渡すのが定石です。一方 Gemini は音声・動画も直接読めるので、ここだけは例外として覚えておくと便利です。

出せるもの(出力)

出すほうも、入力とまったく同じ4分類で見られます。

出せるものClaudeChatGPTGemini
テキスト(文章・表・コード/HTML・SVGの図解やWebページ)
画像(写真調)×
音声・動画×××
ソフト専用データ(Word / Excel / PDF)

テキスト(文章・表)は3社とも得意。違いが出るのは 画像です。Claude は写真のような画像を出力できません(読むのは得意ですが、描くのは不可)。写真調の画像なら ChatGPT か Gemini の出番。ただし Claude は Webページ作りが得意で、HTML/SVG による 図・グラフ・デザインを“描く”のはむしろ大の得意です。

ソフト専用データ(Word・Excel・PDF)は、いまは3社ともファイル作成機能で書き出せます。一方 音声・動画の“生成” だけは、LLM単体ではなく後で触れる 特化型AI の領域です。

あっと驚く変換の実例

ここからは実演です。どれも「データを渡して、変換を頼むだけ」。手作業だと何時間もかかることが、一瞬で片づきます。

表・数値の整形/集計

崩れたデータや Excel・CSV を渡して、整形・集計はもちろん、データの“掃除”まで任せられます。

(バラバラの売上メモを貼り付け、または Excel を添付して)
「日付・商品・金額」の表に整えて、商品ごとの合計と、売上トップ3も出してください。

驚くのはここから。手作業だと地獄の 重複・打ち間違いの修正 も一発です。(※顧客リストは個人情報。社外秘データを外部のAIに渡してよいか、会社のルールを確認してから)

(顧客リストの Excel を添付して)
重複している行と、表記ゆれ・全角半角の混在を見つけて、きれいに直した表にしてください。

なんと グラフの画像 からも数値を取り出せます。

(棒グラフの画像を添付して)このグラフの数値を読み取って、表にしてください。

📷 スクリーンショット(後で差し込み):ぐちゃぐちゃのデータが、整った表+集計になって返ってきた画面

文書の変換

長い文章を、欲しい形に“絞り出し”ます。ただ要約するだけではありません。(※契約書や規約などの機密文書は、外部AIで扱ってよい範囲かを確認してから渡しましょう)

(利用規約やPDFの契約書を添付して)
この契約で“こちらが不利になりうる点”を、重要度つきの表にまとめてください。

大量の声を一瞬で整理することもできます。

(アンケートの自由記述を100件分まとめて貼り付けて)
意見を5〜7個のカテゴリに分類し、それぞれの件数と代表的な声を表にしてください。

お詫びメールのような返信も、いきなり「書いて」ではなく これまでのやり取りを貼り付ける のがコツ。文脈を踏まえた、ちぐはぐにならない返信になります。

(取引先とのこれまでのメールのやり取りを貼り付けて)
この流れを踏まえて、納品が遅れることのお詫びの返信メールを書いてください。
・遅れる理由:部材の入荷遅延 ・新しい納期:6月30日 ・トーン:丁寧でかしこまりすぎない

メールの履歴のように 元データを渡してから変換させる ―― これがチャット相手との大きな違いです。

形式・メディア変換

ある形式から別の形式へ“翻訳”します。極めつけは、Gemini が動画も読めることを活かしたこれ。

(名刺を1枚ずつ見せるように撮った“パラパラ動画”を Gemini に添付して)
各名刺から、会社名・氏名・電話・メールを読み取って、一覧表にしてください。

動画をそのまま渡せるのは Gemini ならでは。専用の名刺アプリがいらなくなるレベルです。録音もまとめて変換できます。(※名刺は個人情報、録音も機密を含むことがあるので、扱いには注意を)

(会議の録音を Gemini に添付、または文字起こしを貼り付けて)
文字起こし → 議事録(決定事項)→ やることリスト(担当・期限)の順にまとめてください。
(PDFやスクショの表を添付して)そのままコピーして使えるテキストの表にしてください。

動くWebページ・ミニアプリを作る

“出力”の極めつけがこれ。プログラミングの知識がなくても、説明するだけで動くものが作れます。

お小遣い帳のかんたんなWebアプリを作ってください。
日付・項目・金額を入力すると、一覧に追加されて、合計が自動で出るようにしてください。

その場でプレビューが表示され、気に入らなければ「色を変えて」「合計を月ごとに」と会話で直せます。完成したらHTMLファイルとして保存も可能です。

📷 スクリーンショット(後で差し込み):Claude のアーティファクトに、入力欄と合計が動くお小遣い帳アプリが表示された画面

そして、ここが Claude の隠れた得意技。Claude は写真調の画像こそ出せませんが、Webページの上で図やデザインを“描く”のはむしろ超得意です。HTML や SVG を使うので、インフォグラフィック・フローチャート・図解・チラシ風デザインなどがきれいに作れます。

(Claude で)次の内容を、矢印や囲みを使った見やすい図解(1枚のWebページ)にしてください。
(図にしたい内容を貼る)

「画像が出せない=デザインが苦手」ではありません。作る土俵がラスター画像ではなくWebページなだけ。ここは ChatGPT・Gemini にはない Claude の強みです。

画像の加工・生成

ここまでは実用寄り。最後は、いちばん“映える”画像の加工・生成です。作るなら ChatGPT、直すなら Gemini が基本。

ChatGPT は、説明から一枚を生成。日本語の文字入れも得意になりました。

(ChatGPT で)「夏祭り 7/20 18時〜」という日本語を入れた、
夜店が並ぶお祭りの告知ポスター画像を作ってください。

Gemini(Nano Banana)は、手持ちの写真を編集。SNSでバズった “フィギュア化” もこれです。

(自分やペットの写真を Gemini に添付して)
この写真を、棚に飾れる1/7スケールのフィギュア風の画像にしてください。
(色あせた古い写真を添付して)自然な色をつけて、傷や色あせも修復してください。

手書きのラフを清書イラストに、商品写真の背景差し替えなども得意。もちろん 画像の中の文字を読む のも3社OKです。

(レシートや名刺の写真を添付して)書かれている文字を読み取って、表にしてください。

📷 スクリーンショット(後で差し込み):1枚の写真が、フィギュア風の画像に変換された before / after

⚠️ ひとつだけ約束を。AIは数字や事実を 平気で間違えます。読み取った数値・集計・契約のリスクなど、大事なものは必ず自分でも確認してください。便利さと、鵜呑みにしないことはセットです。

変換の“癖”を知ると完璧

ひととおり見たところで、どのAIがどの変換を得意とするかを整理しておきましょう。ここまで押さえると一人前です。

  • 画像をゼロから作る → ChatGPT:画像生成モデル Images 2.0(通称 gpt-image-2)が、説明から高品質な画像を一から生成するのが得意。日本語の文字入れも上手になりました。
  • 元の画像を編集する → Gemini:画像モデル Nano Banana は、すでにある画像を直す・加工するのが得意。「この写真の背景だけ変えて」のような編集に強い。
  • 文章を読む・整える/Webで“描く” → Claude:長い文書の要約や、自然な文章への整形が得意。写真のような画像は出せませんが、その代わり Webページ作りが得意。HTML や SVG を使って、図・グラフ・チャートやデザインを“描く”のはむしろ超得意です。
  • 画像の中の文字を読む(OCR的な使い方):3社ともOK。レシートやスクショ、手書きメモを撮って「文字に起こして」と頼めます。
  • 説明するだけでWebページを作る:Claude の アーティファクト、ChatGPT・Gemini の Canvas を使うと、「○○できるページを作って」と頼むだけで、その場で動くWebページやミニアプリができ、プレビューまで見られます(特に Claude のアーティファクトが有名)。

💡 ざっくり言うと、作るなら ChatGPT、直すなら Gemini、整えるなら Claude。迷ったらこの3語を思い出してください。

コラム①:要望の抽象度(レベル2編)― 出力の「形」を指定する

第1回では「具体的に頼む」が基本でした。データ変換器では、そこに “出力の形”の指定 を足すと精度が跳ね上がります。

  • Markdownの表で」「CSV形式で」「3列(日付・項目・金額)で
  • 1行ずつ箇条書きで」「500字以内で

「何を」だけでなく 「どんな形で返してほしいか」 を添える。これがレベル2の頼み方のコツです。

コラム②:どの形式で渡せばいい?はAIに聞く

「このファイル、そのまま渡して大丈夫?」と迷ったら、それ自体をAIに聞けばOKです。

手元に○○というデータがあります。あなたに渡すには、
どの形式(コピペ・PDF・Excel・画像など)が一番うまく扱えますか?

渡し方の正解もAIが教えてくれます。わからない形式のまま手を止めない――これが効率化のコツです。

ちょっと寄り道:LLMと「特化型AI」

ここまで使ってきた ChatGPT・Claude・Gemini は、まとめて LLM(大規模言語モデル) と呼ばれます。言葉を軸に、調べ物も変換も画像出力も“なんでも”こなす 汎用の何でも屋 です。

一方で世の中には、たった一つの仕事に全振りした AI があります。これを 特化型AI(専用AI・一芸特化AIとも)と呼びます。画像なら画像だけ、3Dなら3Dだけを、とことん極めたタイプです。

LLM と 特化型AI の違い

LLM(汎用・何でも屋)特化型AI(一芸特化)
ChatGPT / Claude / GeminiMidjourney / Sora / Suno / Meshy など
守備範囲会話・文章・変換・画像…と広い一つの出力(画像/動画/音楽/3D)に集中
手軽さ話しかけるだけ。ついでに作れる専用ツール。用語や操作はやや専門的
仕上がり手早く“それなり”作り込み・品質・細かい制御が段違い

ざっくり言うと、サッと一枚なら LLM、本気で作り込むなら特化型AI。役割が違うので、優劣ではなく使い分けです。

代表的な特化型AI(軽く紹介)

  • 画像生成:Midjourney(圧倒的な画力)/Stable Diffusion(自由度が高くローカルでも動く)/Adobe Firefly(商用利用に安心)
  • 動画生成:Sora 2(OpenAI)/Veo 3(Google)/Runway/Kling ―― テキストや画像から数秒の動画を生成
  • 音楽・音声:Suno・Udio(数語でBGMや楽曲)/ElevenLabs(自然なナレーション)
  • 3Dモデル生成:Meshy(3Dプリント向き)/Tripo(画像1枚から高速)/Rodin(人物・アバター)

💡 実は、LLM に「画像を作って」と頼むと、裏でこうした生成の仕組みが動いていることもあります。まずは LLM で気軽に試して、「もっと本気で作り込みたい」と思ったら特化型AIへ――という順番がおすすめです。

まだWebで完結する、その限界

ここまで、ぜんぶスマホ・パソコンのチャット画面の中で完結しています。それでも十分すごいのですが、限界もあります。

  • 毎回、自分でコピペ・添付する手作業が残る
  • AIは 渡した分しか見えない。フォルダの中の何十個のファイルをまとめて、とはいかない

次回(第3回)は、ここを越えます。AIを 「現場監督」 とみなし、あなたのパソコンのファイルを直接見て・触ってもらう段階へ。コピペすら要らなくなります。