見出し画像

【ML用の新言語。速度がPythonの35000倍ってエグいな…】の感想

このツイートの感想をさらっと、

【感想】

 結局、今時、Python勉強するくらいなら、コンパイラーの性能でも向上させていた方がまだましです。C++がもてはやされた時代がありましたが、何だかんだ言ってもプログラミングが解っている人ならC言語で十分です。OOP(C++のようなオブジェクト指向)も、入門者向けに作られているので、アセンブリ言語やC言語が理解できている人なら、わざわざプログラミング初心者向けの言語を使う意味があまりありません。Phthonも簡単に使えるようにできているので、流行っただけでコンピュータの基礎が解っていれば、C言語の方が良いかもしれません。

 Pythonは非常に人気があり、汎用性のあるプログラミング言語ですが、いくつかの弱点があります。

(1) 実行速度: Pythonはインタープリタ言語であるため、コンパイル済みの言語(C、C++など)と比較して実行速度が遅いことが一般的です。これは、特にパフォーマンスが重要なアプリケーションやリアルタイムシステムにおいて問題となることがあります。

(2) グローバルインタープリタロック (GIL): Pythonのマルチスレッド処理は、グローバルインタープリタロック (GIL) によって制限されています。GILは、一度に1つのスレッドしかPythonインタープリタにアクセスできないように制限する仕組みです。これにより、マルチコアプロセッサを活用できず、並列処理が制限されることがあります。

(3) モバイルアプリ開発: Pythonは、ウェブアプリケーションやデスクトップアプリケーションの開発に広く使用されていますが、モバイルアプリ開発にはそれほど適していません。ネイティブのiOSやAndroidアプリ開発には、SwiftやJava、Kotlinなどの言語が一般的に使用されます。

(4) メモリ消費: Pythonは、メモリ管理が自動化されており、ガーベジコレクションが行われます。しかし、この自動化により、メモリ消費がやや高くなることがあります。リソースが限られた環境や組み込みシステムでは、この点が問題となることがあります。

(5) パッケージ依存性: Pythonの強力なエコシステムは、多くの外部パッケージやライブラリに依存しています。これらの依存関係は、アプリケーションのデプロイメントや管理を複雑にすることがあります。また、互換性の問題やセキュリティの脆弱性が発生する可能性もあります。

 但し、これらの問題はC言語が理解できていれば大した問題ではありません。

 C言語ベースでPythonで作ってあるライブラリーをコンパイルしてから取り込むようなアプローチとしては、C言語ベースでPython用に作成されたライブラリをコンパイルし、Pythonから直接呼び出す方法がいくつかあります。このアプローチは、Pythonのパフォーマンスの問題を改善するのに役立ちます。一般的な方法は以下の通りです。

(1) CPython拡張モジュール: CPython拡張モジュールを使用すると、C言語で書かれたコードをPythonから直接呼び出すことができます。これにより、パフォーマンスが向上し、Pythonの実行速度の遅さを克服できます。拡張モジュールの作成には、PythonのC APIを使用します。ただし、この方法では、Pythonのバージョンや実装に関連する互換性の問題が発生する可能性があります。

(2) ctypesとcffi: ctypesとcffiは、Pythonの標準ライブラリとサードパーティのライブラリであり、C言語のライブラリを動的にロードしてPythonから呼び出すことができます。これらのライブラリを使用すると、PythonからC言語の関数を直接呼び出し、データ型を変換できます。ctypesとcffiは、CPython拡張モジュールよりも簡単に使用でき、互換性の問題が少ないです。

(3) Cython: Cythonは、Pythonの上位互換言語であり、PythonコードをCまたはC++コードに変換し、コンパイルすることができます。Cythonを使用すると、PythonとC/C++の間で簡単に相互運用が可能になります。Cythonは、Pythonの実行速度を向上させるだけでなく、既存のC/C++コードをPythonに組み込むことも容易になります。

 これらのアプローチを使用して、Pythonプログラムのパフォーマンスを向上させることができます。ただし、C言語との相互運用には注意が必要です。特に、メモリ管理、エラー処理、データ型の変換などに注意を払う必要があります。

 この注意が必要と言うのは、C言語が解っていない人には要注意という意味です。そもそもC言語の特徴はアセンブリ言語のように、直接RAMや、レジスターや、スタックなどにアクセスできることなので、この辺の基礎が解っていない人がC言語を使うと、メモリーエラーや、スタックオーバーフリーになってしまうのです。

 MOJOは、PythonとMLIR(多言語中間表現)の要素を組み合わせた新しいプログラミング言語で、AI開発を対象としています。MOJOが高速である理由は、以下のような特徴があるためです。

(1) MLIRの利用: MOJOは、コンパイル時にMLIRを利用しています。MLIRは、高性能の機械学習コンパイラを実現するためのオープンソースのコンパイラインフラストラクチャで、最適化とコード生成の柔軟性が向上します。これにより、効率的な実行プランを生成することができ、高速な実行が可能になります。

(2) Pythonとの統合: MOJOは、Pythonとの互換性を保持しています。Pythonは、AIと機械学習の分野で広く使用されている言語ですが、パフォーマンスの問題があります。MOJOは、Pythonの人気の高い機能を利用しながら、パフォーマンスを向上させることを目指しています。

(3) コンパイル時最適化: MOJOは、コンパイル時に最適化を行い、効率的な実行コードを生成します。これにより、ランタイムパフォーマンスが向上し、実行速度が速くなります。

(4) ハードウェアとの相互運用性: MOJOは、さまざまなハードウェアプラットフォーム(CPU、GPU、TPUなど)で効率的に実行できるように設計されています。これにより、ハードウェアの性能を最大限に活用でき、高速な実行が可能になります。

(5) 並行処理と分散処理: MOJOは、並行処理と分散処理をサポートしており、複数のコアやマシンで効率的に処理を行うことができます。これにより、大規模なAIタスクを高速に実行できます。

 これらの特徴により、MOJOはPythonよりも高速な実行が可能であり、AI開発に適したプログラミング言語となっています。ただし、MOJOは現在開発中の言語であり、今後の成長や普及によって実際のパフォーマンスがどの程度向上するかは未知数です。

 しかし、C言語でスタックやメモリの管理に精通しているプログラマがPythonのコンパイル済みのライブラリを組み込むことで、高速で効率的な実行が期待できます。C言語は高速で効率的なパフォーマンスを提供するため、その知識と技術を活用することでPythonプログラムのパフォーマンスを向上させることができます。

 実際に多くの高性能Pythonライブラリは、C言語(またはC++、Fortranなど)で書かれたコンパイル済みのコードに依存しています。たとえば、NumPyやPandasは、Pythonのインターフェイスを提供しながら、内部的にはC言語やC++で実装されている部分があります。これにより、Pythonプログラムのパフォーマンスが大幅に向上します。

 但し、C言語での実装には以下のようなデメリットがあります:

(1) 開発の複雑さ:C言語でのコードの記述やデバッグは、Pythonに比べて複雑で時間がかかる場合があります。また、メモリ管理やポインタ操作など、C言語特有の問題に対処する必要があります。

(2) 可読性と保守性:C言語で記述されたコードは、Pythonに比べて可読性が低く、保守性にも劣る場合があります。これにより、コードの理解や修正が難しくなる可能性があります。

(3) ポータビリティ:C言語で書かれたコードは、異なるプラットフォームやアーキテクチャ間での移植性が低い場合があります。Pythonはインタプリタ言語であるため、比較的簡単に異なる環境で実行できます。

 このように、C言語を用いたPythonのコンパイル済みライブラリの組み込みは、パフォーマンスの向上に寄与することがありますが、開発の複雑さや可読性・保守性の低下、移植性の問題など、慎重に検討する必要があります。

 ところが、開発の複雑さに関しては、プログラミングに特化したAIやツールを利用することで、一部解決できる可能性があります。以下は、そのようなツールの例です。

(1) 自動コード生成:AIや機械学習を活用して、高レベルの仕様や要件から自動的にコードを生成するツールが開発されています。これにより、開発者は複雑なコードの記述やデバッグをある程度回避できるかもしれません。

(2) コード補完とリファクタリング:統合開発環境(IDE)やプログラミングエディタには、コード補完やリファクタリング機能が提供されています。これらの機能は、AIや機械学習を活用してコードの品質や保守性を向上させることができます。

(3) 静的コード解析:静的コード解析ツールは、コードを実行せずに問題やバグを検出するのに役立ちます。AIや機械学習を活用した静的コード解析ツールは、開発者がコードの品質や保守性を向上させるのに役立ちます。

 但し、これらのAIやツールはまだ発展途上であり、すべての複雑さや問題を完全に解決するわけではありません。また、これらのツールを使用する場合でも、開発者がコードの品質や効率を確保するために、適切な知識や経験が必要です。AIやツールは開発の助けとなりますが、現段階ではまだ人間の専門知識に完全に依存している面もありますが、C言語の基本ができてる人にとっては、その程度の専門知識は大したことではありません。

この記事が気に入ったらサポートをしてみませんか?