存在しない記憶が増加した

精神分析が流行した期間、多くの心理問題は幼年期のトラウマが原因だと考えられていたため、一部の心理医は幼年期の記憶を掘り起こす傾向がありました。しかし、方法が誘導的であった可能性があり、虚偽の性的虐待の申し立て のような虚偽の告発が現れました。

マッツ・ミケルセン(マッツ・ミケルセン)が出演した映画『偽りなき者』は、この種の冤罪の一つの現れです。学者の中には、このような虚偽の記憶に関心を持つ人がいたため、実験を計画しました。少数の 5 歳の子供を募集し、その両親に過去の ショッピングモールで迷子になったという虚偽の物語 を 1 週間頻繁に語らせたところ、約 25 % の子供がそれを記憶として扱い、欠落した詳細まで補完したことがわかりました。

ただし、この種の記憶の埋め込み実験は非常に非倫理的であるため、近年では同様の実験は行われていないようです。幸いなことに、観察できる広範な社会現象があります。それは マンデラエフェクト です。2013 年にマンデラが亡くなった際、南アフリカ国外の多くの人々が、マンデラは前世紀に亡くなったのではないかと述べました。

そして、歌詞「五十六個民族」、書籍中の「𪠽」(噹 の簡体字版)の字、ピカチュウの尻尾の色など、多くの人が自分の記憶と事実が一致しないと感じています。社会で大規模な新型脳炎の流行が発生したわけではないので、運命探知 (Reading Steiner)を発動して、他の世界線の歴史を見たのではなく、単に広範な 誤った記憶 です。

現在の AI 画像は非常にリアルに作成できるため、それを虚偽の記憶の埋め込みに使用すると、より効率が高まる可能性があります。X ユーザー 寒漣漪 は、このように心配しています。

多模态 LLM がもたらす 第二の脳

Color OS を 830 バージョンに更新した後、一键闪记/小布记忆機能が増えました。一加 Ace 5 Pro には専用の AI ボタンがないため、三本指で上にスワイプして一键闪记を起動する必要があります。しばらく待つと、コンテンツは小布记忆に保存されます。

小布记忆の原理は、スクリーンショットを撮影して多模态の LLM で処理し、スクリーンショットのサマリーとタグを生成する(同様のメモと関連付けることもできます)ことで、後で簡単に使用できるようにすることです。一部対応アプリでは、API を使用して全文とリンクを読み取ることができるため、小布记忆はアプリを跨いでのコンテンツ収集機能になります。

小布记忆と呼ばれる理由は、システムに搭載されている AI である小布助手がこのコンテンツにアクセスできるためです。しかし、これらはすべてネットワークに依存しており、プライバシーの問題があります。多くのアプリは API に対応していないため、gledos は使用しません。しかし、この設計は非常に興味深く、将来オープンソースの実装が期待されます。

大規模言語モデルの思考を追跡する

大規模言語モデル(LLM) の思考過程は、ずっと謎めいています。パラメータが多すぎて、直接分析できないからです。しかし最近、AI 企業 Anthropic は神経科学の分野からインスピレーションを得て、生物の脳を研究するのと同じように、LLM の思考方法を研究し、多くの興味深い発見を得ました。

研究されたモデルは Claude 3.5 Haiku で、研究者は LLM が共通の思考言語を使用し、将来の出力する単語を事前に計画しているという確固たる証拠を見つけました。しかし、懸念される「欺瞞」、あるいはある種の二重思考も存在します。いくつかの実験を以下に示します。

それぞれ Claude に small, 「小」, petit の反意語を言わせると、Claude はその言語における小と大に関する部分を活性化するだけでなく、共有空間における小と大の意味に関する部分も活性化することがわかりました。小規模言語モデルと比較して、LLM は言語間の共有特性の割合が大きいです。したがって、より強力な LLM をトレーニングすると、他の言語の知識をより活用できるため、そのクロス言語能力も向上します。

Claude の暗算は非常に奇妙で、計算結果が 100 を超えない 2 桁の足し算の場合、近似値と 1 の位の正確な値をそれぞれ計算しました。たとえば、36 + 59 の場合、Claude は 88-97 の範囲と、正確な 1 の位の数 5 を並行して計算し、最後に 95 という結果を導き出しました。そして Claude に計算プロセスを尋ねると、標準的な 10 の位と 1 の位を足す流れを繰り返すだけで、自分の本当の思考方法を言うことができません。

その他の実験結果とその論文へのリンクは、Anthropic の Tracing the thoughts of a large language model のブログ記事をご覧ください。

Gibberlink

先月、2 つの AI agent が互いにチャットするビデオ が、ネットワーク上で非常に話題になりました。ビデオは、ホテルの受付 AI agent とホテルを予約する AI agent の交流をシミュレートし、相手も AI であることに気づいた後、Gibberlink モードを使用する提案を開始しました。そこで両者は、人間には理解できない言語を使って、ホテルの予約事項について話し合い始めました。

しかし、技術に詳しくない人は、これに非常に警戒するかもしれません。2 つの AI がユーザーには理解できない言語を使って、他のことを議論する可能性があると考えるかもしれません…《フォーブス》 誌も記事を発表し、Gibberlink が人々の懸念を引き起こす原因とその理由を重点的に記述し、最後に Gibberlink と AI 技術を規制するものの、イノベーションを抑制すべきではないと述べました。

しかし、ソフトウェアを理解している人にとっては、これについて心配することはありません。例えば、Telegram のニュースチャンネル「風向旗参考快讯」のコメントでは、リスクがあるとは誰も考えていません。結局のところ、現在の AI agent は AI のようにブラックボックスではなく、様々な機能はすべて人為的に設計されており、オープンソースの Gibberlink もその 1 つです。

Gibberlink で心配する必要がある問題は、おそらくプライバシーでしょう。デモのように、パソコンで予約し、携帯電話の AI agent でやり取りする場合、スピーカーをオンにする必要があります。もしかしたら、公共の場所にいる他の人が録音して、原文に翻訳できるかもしれません。幸いなことに、Gibberlink のベースとなっている ggwave はエンドツーエンドの暗号化をサポートしており、時間をかけて公開鍵を自動的に交換すれば、通話が通信会社に傍受されるのを防ぐこともできます。

知覚過負荷について

『名探偵コナン』第 707 話で、意味飽和 の概念(日本でいう ゲシュタルト崩壊)が登場しました。これは、人が同じ文字を繰り返し見ていると、突然その文字が分からなくなる現象を指します。

1956 年、神経学者の Jasper と Sharpless による研究「覚醒反応の習慣」では、イソギンチャクが水滴に遭遇した際、最初は激しく収縮するものの、何度も水滴を受けるうちに慣れて反応しなくなることが観察されました。

同様の反応の習慣は、他の生物にも存在します。例えば、工場や道路の近くに住む人や動物は、騒音に対して鈍感になることがあります。あるいは、トイレに長くいると、臭いを感じなくなる(嗅覚疲労)ことがあります。ウェブサイトやソフトウェアは、何かを思い出させるために(例えば広告や通知)、しばしばバナーやトップを使用しますが、このようなものは強調すればするほど、ユーザーに見過ごされる(バナーブラインドネス)傾向があります。

情報過多 もまた、誰もすべての本を読めるわけではないため発生します。これは知識の伝達効率が低いことを意味する可能性があります。そしてこの問題を解決する方法は、大規模言語モデルかもしれません。

例えば、Telegram のグループチャット情報を整理するボット:insights-bot は、以前のグループ交流のトピックをそれぞれ識別し、議論に参加していないグループメンバーが、先ほどのトピックを理解するのを容易にします。

Adam Moran の記事を参考にしました。

ゲームだけがなし得る事——インタラクティブ性

著名なゲーム YouTuber MatPat は 2016 年にバチカンに招待され、インターネット 世界 サミットに参加しました。彼は教皇に Undertale (《Undertale》) というゲーム の Steam CD-Key を贈りました。その理由は、このゲーム が暴力を推奨しておらず、ゲームプレイ が平和主義的な方法でクリアしやすく、プレイヤー にとって良い影響を与える例だからです。

Undertale (《Undertale》) のプロット ルートは多く、プレイヤー のほぼすべての「選択」がその後のプロット に影響を与えます。ゲーム のデザイン上、多くのプレイヤー は平和的なルートをたどる傾向がありますが、殺害の選択肢はほとんど常にプレイヤー の手の中にあります。これも、ゲーム のインタラクティブ性が最もよく表れていることの 1 つです。

インタラクティブ性は、実際にはゲーム 固有の特性ではありません。たとえば、小説や漫画は特定の段階で選択肢に入ることができ、異なる選択肢が異なるページにジャンプします。Web ページ、PPT、または何らかのソフトウェアを使用して自動ジャンプを実装し、ランダムに表示してはならないプロット をインターフェース の背後に隠すと、初期のテキスト アドベンチャー ゲーム とほとんど同じになります。

インタラクティブ ビデオ、さらにはインタラクティブ 映画も存在しますが、撮影コストが高いため、常に短く、少ないです。代わりに、一部のゲーム はインタラクティブ 映画と呼ばれています。

過去 10 年間で比較的有名で、大規模な制作のインタラクティブ 映画は、《Quantum Break (量子 破碎)》と《Black Mirror: Bandersnatch (黑镜:潘达斯奈基)》くらいでしょう。前者は《Quantum Break (量子 破碎)》ゲーム 本体の一部であり、《Black Mirror: Bandersnatch (黑镜:潘达斯奈基)》は Netflix 独占作品ですが、評価はあまり良くなく、インタラクティブ 映画を試み続ける人はあまりいません。

ゲーム はソフトウェアであるため、再利用できるコンテンツ は非常に多くあります。シンプルなシーンを撮影した短編映画のコストは、同じコンテンツ のゲーム を制作するよりも安価で簡単な場合がありますが、コンテンツ が複雑になると、撮影する必要があるシーンが指数関数的に増加し、ゲーム のリアルタイム レンダリングと再利用の利点が強調されます。そのため、インタラクティブ性はゲーム だけがなし得る事なのです。

ただし、AI が爆発的に発展している今日では、AI に依存することでインタラクティブ 映画のコストを削減できる可能性があります。具体的な景色はまだ想像できませんが、AI スタントマンが登場するかもしれません。主要なプロット を撮影するだけで、AI スタントマンが他の行動をする主人公を演じ、プロット に多くの分岐を生み出すことができます。ボルヘスが想像した《The Garden of Forking Paths (小径分岔的花园)》が実現するかもしれません。