Skip to content

これからのAIの在り方を想像する

Author: Kazukichi
  • AIエージェントに入門した
  • その後もちょくちょくRoo Codeを使っているが、ゼロベースでバイブコーディングをやってみたりとかはできていないので近いうちにやってみたい
  • 前回はAIエージェント以前・以後で何がどう変わるかと、今後どのようなスキルが必要になってくるかについて考えた
  • 今回は、前回と若干重複する内容もあるが、現状のAIは何が弱点で今後どのように解決されていくかや、我々には何が残されるのかについて考えてみる
  • 現在のLLMはコンテキストウィンドウが小さい
    • コンテキストウィンドウの単位はトークンで、トークンはおおよそ単語だと考えると良い
    • ChatGPT 4oは128,000トークン
    • Claude 3.7 Sonnetは128,000トークン
    • DeepSeek-V3は128,000トークン
    • ※ 実際にはアプリケーションレベルで制限が入っていることもある
  • 10万と聞くと多く感じるが、ご存知の通り、実際に使ってみると割とすぐに話したことを忘れてしまう
  • つまり、ざっくりというとユーザとのやり取り≒エピソード記憶が苦手
  • 解決策
    • トークン数の向上
      • 実際に、MetaのLlama4 Scoutは1,000万トークン(単行本1,000冊ぶん)をサポートしており、向上が見て取れる
      • ただし、何トークンあれば充分かは不明
    • Memory Bankの活用
      • LLMの外部に記憶を持つ仕組み
      • ChatGPTにも似たような機能あるよね
    • RAG(Retrieval-Augmented Generation)、ファインチューニング
      • これはLLM本体が持たない情報を追加で提供する仕組みなので、エピソード記憶というよりも意味記憶に近い
    • MCP(Model Context Protocol)
      • 最近やたらと騒がれているAnthoropicが考案したプロトコル
      • 通信方式としてはstdin/stdout or SSE(Server-Sent Events) or Streamable HTTP
      • データ構造はJSON-RPC
      • 今後はRAGもMCPで提供されていくと予想
  • これらの技術により、1人1つ以上のAIを持ち、それを育て挙げていくような時代がやってくると予想
  • 新たなビジネスの創出
    • 希少な情報を持つ(例えばリーク情報とか)RAGの提供
    • AIブリーダーが育て上げたAIがペットとして販売される
    • そうなると情報格差の問題は解決しないかもしれないし、自分(とAI)の経験に対する価値が高まるかもしれない
      • 現在でもプロンプトエンジニアリングや .cursorrules に一定の価値が生まれている
  • 現在はテキストでの入力が一般的だが、部分的には進化も見られる
    • 入力面: 音声入力(例えば SuperWhisper)等のマルチモーダル対応
    • 出力面: 音楽、画像、動画等
  • 1つのAIに対して複数のインタフェースを持つことが当たり前になると予想
    • 例えばチャットやコーディングエディタ、ロボットやホログラム等の偶像を持ったものも現れるかもしれない
      • 特にロボティクスと結びついた場合、長期的な視点ではブルーカラーの仕事も減っていく可能性がある(現状はホワイトカラーにフォーカスされている)
    • アンビエント・エージェントという概念も生まれており、AIは自然/環境に溶け込んでいくのかもしれない
      • 我々が指示しなくても察して行動してくれるようなメンヘラ御用達UI
      • メールの受信を検知し、返信メールを事前に考えておいてくれる、等
    • いうなれば今は各ソリューションが統合されていない状態
      • 各AI技術をDIY的に繋ぎ合わせる必要がある
  • MCPの発展
    • MCPはRAGのような追加情報の提供の他にも、ツールを動作させることもできる
    • それにより、CADで設計 -> 3Dプリンタで印刷までワンストップでできるようになるかもしれない
  • 人間がボトルネックになる
    • BMI(ブレインマシンインタフェース)への需要がより高まるかもしれない
  • コンピュータのスペックは今後も進化していく見込みがある程度ある
    • SoC(System on a Chip)
    • TPUやNPU等の専用ハードウェアの台頭
    • 通信技術の発展(6G)
    • シリコンフォトニクス
      • NTTがIOWNで取り組んでいる
    • 量子コンピュータ
    • ※ ただし、ムーアの法則は現状はあまり成立していない
  • モデルの効率化、軽量化
    • DeepSeekやSakana AIが力を入れている
    • 蒸留、量子化、MoE、進化的モデルマージ等
  • エッジ環境(IoTとの組み合わせ)やローカル環境(製品に組み込まれる等)で使われることも増えると予想
  • ゲーム内のCPそれぞれが生成AIベースで人格を持ったキャラクターとして自由に振る舞うことができるかも
    • そうなるとメタバース的な文脈に繋がってWeb 3が再熱するかも

言語やライブラリの発展は停滞する

Section titled “言語やライブラリの発展は停滞する”
  • これまでは人間がプログラミング言語/ライブラリを読み書きするという前提で進化してきた
  • しかし、今後はAIがプログラミング言語/ライブラリを読み書きすることが前提となる
  • そうなると、わざわざプログラミング言語やライブラリの「人間にとっての使いやすさ」という文脈で発明をする必要性は少なくなってくると予想
  • 逆に、新しい技術領域の問題を解決したり、AIにとっての使いやすさという文脈では発展する余地がある
  • 現状は古く成熟した言語やライブラリの方がLLMにより学習されており、恩恵を受けやすい
  • しかし、今後はMCP経由で言語やライブラリの情報を併せて提供するというのが一般的になっていくかもしれない

プログラミングのたのしさは減っていく

Section titled “プログラミングのたのしさは減っていく”
  • 仕事において、要件定義、設計、実装、テスト、デプロイはAIができる作業となっていくだろう
  • 我々に残されるのは要求定義、デバッグ、品質保証、結果責任、(望んだ実装が出るまでの)ガチャ、pit of deathの停止
  • つまり、副操縦士として各プロセスに現れるちょっとした不備を修正する作業になる

娯楽・スポーツとしてのプログラミングの勃興

Section titled “娯楽・スポーツとしてのプログラミングの勃興”
  • 知的労働もどんどんスポーツ化していく
    • 車や電車、飛行機があるからといって人間が100m走ることに価値がないということにはならない
    • 現在でも記憶力選手権や競技クイズ、競技プログラミング等の大会があるが、今後はもっと多様化していくと予想
  • 生成AIによってノーコードが成立してしまうと、自社でドメイン知識は持ってるので内製が加速すると予想(DXの達成)
  • 実際に中小のITベンダの倒産件数は増加している
  • ただ、受託企業は上流工程のナレッジを持ってるので、そういった部分を対AI向けに使うためのソリューション(DocDDとか)として落とし込み、マネタイズしていくかも
  • 細分化された専門家は大量生産時代のもの
    • フロントエンドエンジニア、バックエンドエンジニア、インフラエンジニア、etc …
  • 従来の職人のように「作りたいもの」をベースに、垂直統合したスキルを持つ人が増えていく
  • これはかつて登大遊が提唱した概念
  • 設計 -> 実装レベルまで感覚的に行い、プログラミングはただ、頭にある実装を書き起こすだけの作業として扱う
  • これは生まれつきのセンスや多くのトレーニングを経て得たスキルのように思う
  • つまり、我々がネイティブに日本語を話せている状態、プロのピアノ奏者が感覚的に演奏できる状態、たくさん練習したから自転車に乗れているといった状態
  • しかし、Vibe Codingの発展で、プログラミングにおける「そこ」に至るまでの経路がぐっと縮まる可能性がある
  • 実際にデータポイズニングという攻撃手法が出ている
  • 現状でもハルシネーションは起きている
  • フェイクニュースを発信するサイトを増やすことで、それを学習したLLMにそれを真実として学習させることができる
  • AGI(汎用人工知能)の実現には上記に挙げたような弱点の克服が必要になる
  • 他にも高度な自律性や自己改善性も必要
  • 個人的には、意識がどこから生まれるのかといった脳科学的な側面やシンギュラリティといったトピックが気になっている
  • 攻殻機動隊やPSYCHO-PASSのような世界を楽しもう
  • 言語化能力、コミュニケーション能力の向上
    • 短期的・中期的には要件定義や設計
      • 構造化やOOPのアプローチ
    • 長期的には要求定義
    • 対人間、対AIの両方の視点で学ぶ必要がある
    • ソフトウェア工学を学ぶのは効果的かもしれない
    • DocDDを初め、このあたりのソリューションは今後どんどん整備されていくのではないか
  • AIパイプラインの整備
    • どの作業にどのAIが適用できるか
    • それらをどう連携できるか
    • 自分がマネージャとなり、AIチームを組織するイメージ
  • 研究の営み
    • AIがまだ知らないことを探求するのは人間に残された大切な仕事
      • この領域がAIに置き換えられるときは、それこそシンギュラリティを迎えたときだと思う
      • Sakana AIが AI Scientist を開発しているので雲行きは怪しい
    • また、要求定義を行う際にも、その仕様にどう新規性があり、面白く、有用なのかといったアイデアの部分が活きてくる
  • AIファースト
    • 従来型の開発では、コードを1日1万行生成できたとしても、それを確認するのが人間である限り、それがボトルネックとなってしまう
    • なので、どのようにしてブラックボックス性を許容するか、という視点が必要
    • セキュリティ要件、パフォーマンス、品質等をどのように満たすか
    • 人間によるコードレビューや手動テスト、手動リリースでは立ち行かなくなる
    • マインドセット、文化、組織構造、開発プロセス、ビジネスや市場へのアプローチの大幅な見直しを余儀なくされる
      • DXが流行っていたときにも聞きましたね
  • 低レイヤを知る
    • AIエージェントが充分に進化し、普及すれば、フロントエンドやバックエンドの表層的な部分の理解も「低レイヤ」の領域となっていくと予想
    • 現状でも、アプリケーションエンジニアがインフラ等の低レイヤの知識を持っている方が効率的な実装や的確なトラブルシューティングが容易になる
    • それと同じで、AIが書き散らしたブラックボックスなコード上で問題が起きた際に、それを深堀りできる力も評価されるようになっていくのでは
    • また、現状のモデルでは、プログラミング言語という中間的な表現があるからこそ、人間とAIの間で厳密性のあるやり取りが可能になっているともいえる
  • レガシー/マイナー/精密さが求められる領域での活躍
    • 技術的負債となった非合理性の塊のコードベースや超マイナーなフレームワーク、洗練されたUI/UXの構築
    • このあたりはAIが苦手な領域だと思われる
  • バイブコーディング体験
  • MCPサーバを立ててみる
  • Devin、Perplexity、NotebookLM、SuperWhisper辺りの技術/ツールを検証する
  • 前にやっていたHCIの歴史の深堀りの続き
  • AI時代のHCIがどうなっていくかの調査と考察