Geminiすげえ 2025/05/15 X Space

Geminiすげえ 2025/05/15 X Space

みなさんこんにちは。 @nullpopopo です。先日戯れにXでSpaceしてみたんですけれども、 @bgnori さんとAIやインテリジェンスについて語ったのが面白かったので、 @bgnori さんのご許可を得て Youtube 化しました。

実はこの動画作るときにどうにか文字起こしできないかなーと思ったのですが、考えてみたらこれもGeminiに要約させたほうがいいかなー、ということで以下に要約します。


Geminiの能力について:

  • 高性能な音声入力と読み上げ: Geminiの音声入力は非常にスムーズで、話が終わると自動で文字起こしされ、さらにその内容を音声で読み上げてくれるため、視覚障碍者にとっても非常に使いやすいと語られています [08:27], [14:13], [14:58]。
  • 高度な検索能力: 従来の検索エンジンでは難しかったような曖昧な質問や、複数の情報源を横断した検索、レポート作成なども得意としています [37:25], [57:59], [01:00:33], [01:02:10]。
  • 文脈理解と自然な対話: Geminiは文脈を理解し、まるで人間と対話しているかのように自然な受け答えができると評価されています [38:56], [41:01], [42:44]。
  • パーソナライズされた情報提供: GoogleカレンダーやYouTubeなどのアカウントと連携することで、個人の状況に合わせた情報提供やアシスタント機能を発揮します [36:41], [37:13]。
  • 著名人の口調の再現: 冗談交じりに、トランプ大統領やひろゆきなど、特定人物の話し方を真似た応答もできることが紹介されています [18:23], [20:48]。

AI全般について:

  • 初期のAIからの進化: 以前のAIに見られたハルシネーション(もっともらしい嘘をつく)のような問題が改善され、実用的なレベルに達していると感じられています [23:05]。
  • 人間の脳の外部拡張: AIは、最初の調べ物や環境設定など、人間が行うには手間がかかる作業を効率化する点で、脳の機能を拡張するような役割を果たすと述べられています [24:30], [24:36]。
  • 情報過多時代の情報処理: ニュースやビジネス系動画など、大量の情報を効率的に理解するためにAIが役立つと語られています [52:53], [53:13]。
  • 翻訳の進化: GeminiのようなAIが登場したことで、翻訳アプリが不要になる可能性や、翻訳者の役割が変化する可能性が示唆されています [28:52], [29:05]。
  • AI監督の重要性: AIを効果的に活用するためには、AIに適切な指示を与え、その出力を評価する「AI監督」のスキルが重要になると指摘されています [26:31]。
  • 弱者のためのツール: 必ずしも頭の良い人だけでなく、AIは情報弱者が戦うための強力なツールになり得るとの意見が出ています [26:50]。
  • 倫理的な配慮の重要性: サービス開発において、ユーザーに恥をかかせないような配慮が重要であり、Geminiはその点で優れていると評価されています [45:36], [46:28]。

SpaceXと宇宙開発について:

  • Starlinkの可能性: Starlinkのような衛星通信サービスが、地理的な制約を超えてインターネット接続を提供し、特に過疎地などで強力なインフラになると期待されています [01:16:04], [01:16:31]。
  • SpaceXの革新性: ロケットの再利用技術や大量生産によるコスト削減など、SpaceXの技術革新が宇宙開発の常識を覆していると語られています [01:22:52], [01:25:46]。
  • Starshipの将来性: Starshipという次世代ロケットの開発により、宇宙輸送能力が飛躍的に向上し、宇宙開発の未来が大きく変わる可能性が示唆されています [01:23:16], [01:28:17]。
  • 宇宙開発を巡る規制: 環境保護などの観点からの規制が、宇宙開発の進展を妨げる側面もあるという意見が出ています [01:39:35], [01:40:40]。

全体として、GeminiをはじめとするAI技術の進化が、情報へのアクセスや処理方法、さらには人々の生活や社会のあり方に大きな変化をもたらす可能性が示唆される内容となっています。また、後半ではSpaceXの革新的な取り組みを通じて、宇宙開発の未来に対する期待感が語られています。


備忘がてら、どうやってこの動画を作成したかというメモを残しておきます。

  1. スペース音声を録音する
  2. wav形式からmp3形式に変換する
  3. 画像ファイルとmp3ファイルから動画(mp4)ファイルに変換する
  4. Youtubeにアップロードする

スペース音声を録音する

スペースを開始するときに録音する設定はできるのですが、X無課金勢だけかもですがダウンロードできないのと一定期間後消えてしまうので、手動でどうにか音声録音することを考えました。録音の方法ですが、Chromeの拡張機能で Audio & Voice Recorder を使っています。子供の頃にテレビの前にラジカセ置いて歌番組録音するかのような懐かしさを覚えてエモみを感じました。

wav形式からmp3形式に変換する

ファイル名をよしなに設定(スペースをアンダーバーにしたり特殊文字を削ったり)して、ffmpegでwavファイルをmp3に変換しました。コマンドはこんな感じに。

FILENAME=2025-05-15_22-45-00_nullpopopo-space.wav

KAKU=$(echo ${FILENAME} | awk 'BEGIN {FS="."} {print $NF}') ; OUTFORMAT=mp3 ; OUTFILE=$(echo ${FILENAME} | sed -e "s/${KAKU}/${OUTFORMAT}/") ; time ffmpeg -i "${FILENAME}" -vn -ac 2 -ar 44100 -ab 256k -acodec libmp3lame -f ${OUTFORMAT} "${OUTFILE}"

画像ファイルとmp3ファイルから動画(mp4)ファイルに変換する

mp3ファイルと同じディレクトリに画像ファイルを置いて、これらをガッチャンコしてmp4ファイルに出力します。コマンドは以下の通り。

IMGFILE=nullpopopo.jpg
MP3FILE=2025-05-15_22-45-00_nullpopopo-space.mp3
OUTPUTFILE=2025-05-15_22-45-00_nullpopopo-space.mp4

time ffmpeg -loop 1 -i ${IMGFILE} -i ${MP3FILE} -c:v libx264 -tune stillimage -pix_fmt yuv420p -vf "scale='min(iw,1920)':'min(ih,1080)':force_original_aspect_ratio=decrease,pad=ceil(iw/2)*2:ceil(ih/2)*2" -c:a aac -b:a 192k -shortest ${OUTPUTFILE}

Youtubeにアップロードする

あとは一般的なYoutube動画アップロードの手順を踏むだけです。動画公開後、Geminiに動画URLを添えて「要約して」と言うだけでいい感じに要約してくれます。

以上です。ね、簡単でしょう?