見出し画像

2023 年の振り返りと 2024 年に向けて

 こんにちはこんばんは、teftef です。年末なので、少し今年 (2023年) のまとめと来年に向けて書きます。1月くらいから、基本的に一週間に1本、気になった論文やドキュメントをまとめてきました。その振り返りも兼ねて書いていきます。 (基本的に自分語りです。)
 私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT-4 による校正、修正が含まれています。

今年やったこと (主な行事)

卒業

 今年は大学を無事に卒業できました。うちの研究室は研究していれば基本的に何をやっても大丈夫というスタンスで、StyleGAN の潜在空間をうまくいじって、特定の属性だけを制御する (スライダー的な) ものを作っていました。結論をいうと、結構うまくいかないもんで、まあ苦労した覚えがあります。それでも何とか卒論を書いて 締め切りの 15 分前に出した覚えがあります。

StableDiffusion In Colab

 A1111 の SD webUI が Google 様の逆鱗に触れたらしく、Google Colab に使うときに警告が出てしまったので、 Diffuseres でその代わりを作りました。今思えば全然機能が足りないですが、これは Diffusers の勉強という側面もあったので、いい経験でした。それと、どのくらいかはわかりませんが、使っていただきありがとうございます。

AITuber 

 あき先生のこのツイートから、作ってみるかと思い立って、友達と調べながら 2 日くらいで作った覚えがあります。最初は pytorch のインストールに半日以上かかっていて、何なら「 ffmpeg って何だ?よくわからないけどトリマコピペで。」と話しながら作っていました。(てかここであき先生と知り合った)

学会

 はじめて学会に出ました。7月くらいから原稿を書きはじめて、書き直しと修正の連続でした。この辺で、無知さに気付いた気がします。結局、わかったつもりでいることが多く、怒られっぱなしでしたが、何がわからないかが見えたので、いい収穫でした。

StreamDiffusion

 だいぶ飛びましたが、今年一番大きな出来事が StreamDiffusion でした。複数人の開発なんてやったことがないので、基本的に探り探りでした。Unet の一部の層を消したり、Diffusers のパイプラインを解剖したり高速化を試みていました。何度かGitHub の Commit を自分ので上書きしてしまってほかの人の Commit を消してしまいました。
 このプロジェクトはまだやることがたくさんあると思うので、来年も引き続きアップデートをしていく予定です。このプロジェクトを通して、今までの input をoutput に回すことが体験でき、それとともに新しい興味や知識、経験を得られて、メンバーのみんなには感謝です。

2024 年はどうするか (どうしよう)

 とりあえず仕事を探さないといけません。日本の就職はどうやら夏、しい
て言うなら春から始まっていたらしく、でもそのときは学会とか出てましたし、もう内定 (オフィシャルではないやつ) をもらってる人を見て、すげーと思っていると同時に焦りもなくはないです。
 修士論文に向けて進捗を出さないとまずいです。今の研究は生成 AI も噛んでいるので、いろんなものを吸収しつつ output できればと考えています。

 それと、他人と比べることを減らしたいなと思いっています。どうしても、この人はこんなことをやってるから自分もと思ってしまい、いろんなものに手を出して、でも結局浅く終わってしまうことが多いと感じたので、来年は狭く深くをもっと重視しようかなと考えています。もちろん完全に業界を見ないわけではなく、ほどほどのリサーチもします。しかし 2023 年みたいに 1週間に一度登場した技術などの解説記事は書かないと思います。それよりも、日記に近いものにしていこうと思います。

ラスト

 2024 年は 2023 年より忙しい年になりそうですが、この note も継続していく予定です。
 最後に 2023 年に少しでも記事をみていただいた方、いいねしていただいた方、購入していただいた方、シェアしていただいた方々に大きな感謝と、引き続きのご高覧いただけますと幸いです。

teftef

この記事が気に入ったらサポートをしてみませんか?