
こんにちは、古川です。
最近、AI業界でちょっとした話題になっているものがあります。
その名も「NanoBanana(ナノバナナ)」。
なんのこっちゃって感じですが正式名称です。
試してみました?
知らない方のために少し解説すると、
Googleの生成AI「Gemini」の最新モデルで、
画像生成・編集に特化したものです。
NanoBananaの特徴は大きく3つで
1つはキャラクターの一貫性が高いこと。
→ 表情や角度を変えても、同一人物として違和感が少ない。
2つ目は自然な指示で部分編集できる
→ 「笑顔にして」「柔らかい光を追加して」などで違和感なく修正。
3つ目はレスポンスが速い
→ ChatGPTよりも待ち時間が短く、サクサク生成できる。体感かなり早い。
実際に触ってみると、プロンプトを工夫しなくても
それなりにクオリティの高い画像を返してくれるので、
「おお、すごい!」となりますね。
ただし──。
やっぱり曖昧な指示だと破綻もします。
当然ですけど。
結局のところ、詳細に言語化して伝える力は必要だと感じました。
僕の考えでは、生成AIはあくまでドラフトを作るツール。
そこから自分の求めるクオリティに近づけようとすると、
ノウハウやテクニックが欠かせません。
だから、普段から触っていない人ほど
「思った通りに出ない → 使えない」
と諦めてしまいやすい。
でも毎日のように使っていると、
「この表現ならうまくいくか?」
「こうしたら精度が上がるな」
と改善策が自然と見えてくるんです。
これは経験則でわかる、AIとの“付き合い方”です。
そこで、大事なのは、ひとつのAIに依存しないことです。
「このAIひとつで全部やろう」とすると、
必ずどこかで壁にぶつかります。
でも、別のAIと組み合わせると圧倒的にクオリティは高くなる
ケースが多いんですよね。
たとえば動画制作なら、シナリオは文章生成 に強いAI
音声はボイス特化AI、映像は動画特化AI
こうやって分業させると、仕上がりの質がまるで違います。
動画生成AIに機能として含まれる音声や
シナリオ生成機能は結構微妙なことが多いので、
この使い方がかなりいいです。
考えてみれば、これは、家電とかでも同じですかね。
パソコンにはカメラもマイクもスピーカーも付いていますけど、
でも、外付けカメラ・コンデンサーマイク
専用スピーカーを用意した方が、
それぞれのクオリティは段違いに高いですよね。
プリンターもそう。
オールインワン複合機は便利ですが、
「スキャナーはスキャナー」
「プリンタはプリンタ」の方が性能は高い。
すべてを包括しているものは便利だけど割と中途半端になりがち。
これはAIでもまったく同じです。
なので、どれか一個ってよりは、
いくつか使える方が断然、仕事にも役立ちます。
AIはチーム戦だ!って感じで
意識して使うといいかもしれないですよ。
これからはAIは使える人がより成果を出していく時代なので、
ぜひ、使いこなす側にまわってください。
それではまた。