人が分るのと電脳が分るは違う

2023年9月29日 10:43

「AIって何?」連載五節で神経電網(ニューラル・ネットワーク)が「文字を記憶する」に結び付くことを示した。思い出してもらいたい、人にとって意味のある「2」や「5」も電脳の神経電網では、記憶域メモリの特定の番地が「1」か「0」に過ぎなかった。

入力は人がするので「2」や「5」と判断できる必要がある。従って縦と横の二次元構造にする必要があった。しかし、解答(出力や正解)は、これを考慮する必要は無い。電脳内で区別できれば良いのだ。神経電網の第三層(解答、出力)は以下の様に短縮できる。

00010 00010を「2」とする
00000 10000を「5」とする

こうすると、第三層の細胞数は10個なので、第二層は30個位に減らせる。どのくらい減らせるかは実装して見ないと分からない。さらに、第三層の各細胞の重みは、第二層の細胞数と同じ30個で良いことになる。これで全体の計算量を減らすことができる。電脳の力が増しているとは言え、計算量を減らす工夫は重要である。以下では減量の流れを示している。

人の顔認証では両目と鼻を四角で囲った、T字型の囲いだけで98%以上の識別が可能と言う研究がある。また、個人個人の違いが複雑な顔も、特殊な加工をすることで単純化することができる。

余談だが、以前顔認証無形具ソフトで、ゴリラの顔に黒人という識別子ラベルが付いてしまって、問題になった事がある。ゴリラと黒人の情報粒データ不足が原因と言う事だった。ゴリラの識別子付与を止める回避策を取ったが、今だに正しくは識別できないらしい。AIは全く万能では無い。

「AIって何?」連載三、四、五節で、解答を二値化して、0と1で文字を表現したが、二値化する前の実数を直接扱うこともできる。例えば、電脳は色を赤、緑、青、透明度の数値(0〜255の整数範囲)で扱い、それらを画面の画素ピクセルに反映させる。しかし、この数値は正規化して、0.0〜1.0の範囲で扱う事もできる。多くの画像無形具ソフトや専用画像有形具ハード機器は小数点方式を採用している。

色を0.0〜1.0の範囲で扱う事が出来るなら、電脳の神経電網で処理する事も可能になる。AIと言うと、顔認証、各種癌診断、農作物生育診断、山林や海洋の自然環境診断、魚の種類識別や数の推定等、画像を処理するものが多いのは、画像電帳ファイルが数値の塊だからである。

音は標本抽出サンプリングにより、相似型アナログから計数型デジタルに変換され、数値の塊の電脳の音源電帳として保存される。これも音声認識等でAIとの相性が良い。

逆に数値化できなものは、電脳の神経電網で直接扱えない。人が介在する工夫がいるが、これは次回としよう。

この記事が気に入ったらサポートをしてみませんか？