NOTE

東北大学所属の学生です。現在4年生。 画像生成AIを主軸として学習、研究をしています。…

NOTE

東北大学所属の学生です。現在4年生。 画像生成AIを主軸として学習、研究をしています。 研究に関連するサーベイの結果や、その他受験に関する体験談についての記事を執筆していきます。 よろしくお願いいたします。

最近の記事

sd webui train toolを改造!

目的Stable Diffusionを用いてmanga109の画像データを学習し、漫画風の画像を生成できるようにしようと考えている。そのための追加学習の方式としてsd webui-train toolを使用しているが、画像の事前処理において画像を正方形に切り出す際に、画像の中心から正方形領域を切り出しているため、変な画像(身体の一部であったり、何の画像か区別のつかない画像)が抽出されてしまう問題があった。そこで今回はtrain toolのコードを書き換えて理想的な処理を施せる

    • manga109のキャラ画像加工④

      背景所属研究室で行っている研究の一環として、漫画用のキャラクタ画像データセットを構築する試みを検討している。manga109 という学術用の許可済み漫画画像データセットが存在するが、そのままではキャラクタの画像が切り抜かれていないため加工して使用することにした。これら処理を行うためにpythonの調査を行い実践しまとめていく。 前回まで前回までで、各ページごとに存在する顔フォルダに対して画像を抽出することができた。 今回の目標今回は、切り取った画像のサイズの確認を行う。

      • manga109のキャラ画像加工③

        背景所属研究室で行っている研究の一環として、漫画用のキャラクタ画像データセットを構築する試みを検討している。manga109 という学術用の許可済み漫画画像データセットが存在するが、そのままではキャラクタの画像が切り抜かれていないため加工して使用することにした。これら処理を行うためにpythonの調査を行い実践しまとめていく。 前回まで前回までで、各ページから人物の顔の座標を抽出することができた。今回は、前回のプログラムで作成したページ顔座標辞書をもとにして画像を加工するプ

        • manga109のキャラ画像加工②

          背景所属研究室で行っている研究の一環として、漫画用のキャラクタ画像データセットを構築する試みを検討している。manga109 という学術用の許可済み漫画画像データセットが存在するが、そのままではキャラクタの画像が切り抜かれていないため加工して使用することにした。これら処理を行うためにpythonの調査を行い実践しまとめていく。 仕様最終的な処理から逆算して仕様を決めていく。最終的には特定の画像から(xmin, ymin), (xmax, ymax)の座標を切り抜くつもりであ

        sd webui train toolを改造!

          manga109のキャラ画像加工

          背景所属研究室で行っている研究の一環として、漫画用のキャラクタ画像データセットを構築する試みを検討している。manga109 という学術用の許可済み漫画画像データセットが存在するが、そのままではキャラクタの画像が切り抜かれていないため加工して使用することにした。これら処理を行うためにpythonの調査を行い実践しまとめていく。 仕様最終的な処理から逆算して仕様を決めていく。最終的には特定の画像から(xmin, ymin), (xmax, ymax)の座標を切り抜くつもりであ

          manga109のキャラ画像加工

          特許庁に入ろう①

          背景自分は来年度から大学院に進学することが決定している。なので今から就活を焦ってする必要はないが、今後のことも考えるとやはりちゃんと考えておくべきだ、ということで人生設計も含めた就職活動についてぼちぼち考えている。そんな折、大学の情報系、電気系の内部生に向けた企業フォーラムが開催された。せっかくの機会なので友人と参加し、理系大学院卒生のキャリアとしてどのようなものが自分にあっているのかを検討する足掛かりとした。 十数社ほど説明を聞きいくつか興味を持った業界や企業があったが、

          特許庁に入ろう①

          Stable Diffusion で漫画を描こう①

          目的所属している研究室にて、Stable Diffusionを用いて漫画を作成する手法について研究している。それなりに方針が固まってきたので、ここでひとつ漫画を作成しながら 手順手順としては以下のような流れになる。 ・設定、プロット  自分の研究ではこのあたりにはあまり注力していないので、chatGPTでプロットの相談やアイデアの整理、提案をするまでにとどめる。 ・キャラクタ  設定に沿ったキャラクタデザインをする。デザインの過程において Stable Diffusion

          Stable Diffusion で漫画を描こう①

          エレキギター改造@創造工学センター③

          概要昨年からエレキギターの演奏やその改造にはまっており、シールなどを作成して改造したりして楽しんでいた。今回、久しぶりに本格改造してみたいと思い、東北大学の設備をたっぷりと利用して自分好みのテレキャスターを作成することにした。 前回までで一通り方針が決まった。 コンセプト・テレキャスタータイプ ・ウッド系塗装 ・彫刻あり ・チェスナットカラー ・オイルフィニッシュ ・ゴールドパーツ ギター入手&分解メルカリで販売されていたplaytechのテレキャスターを購入し、到着直後

          エレキギター改造@創造工学センター③

          エレキギター改造@創造工学センター②

          概要昨年からエレキギターの演奏やその改造にはまっており、シールなどを作成して改造したりして楽しんでいた。今回、久しぶりに本格改造してみたいと思い、東北大学の設備をたっぷりと利用して自分好みのテレキャスターを作成することにした。 前回までで一通り方針が決まった。 コンセプト・テレキャスタータイプ ・ウッド系塗装 ・彫刻あり ・チェスナットカラー ・オイルフィニッシュ ・ゴールドパーツ 以上のコンセプトで、イメージとしてはpaolettiのギター。初めは再塗装を画策していた

          エレキギター改造@創造工学センター②

          エレキギター改造@創造工学センター①

          概要昨年からエレキギターの演奏やその改造にはまっており、シールなどを作成して改造したりして楽しんでいた。 今回、久しぶりに本格改造してみたいと思い、東北大学の設備をたっぷりと利用して自分好みのテレキャスターを作成することにした。 メルカリで送料込みで4500円のテレキャスターを購入した。 こいつを自分仕様に改造したい。&ギターの塗装について勉強したい ということで色々項目に分けて調べる ・塗装剥がし 剥がしの方法はドライヤーとスクレイパーを用いた方法がある、また塗装剥

          エレキギター改造@創造工学センター①

          AIで自動で日本語の文字認識をしよう!①

          この記事の目的 数字や英字、管理の写真データを表に入力して提出する形式のデータ入力業務があった。これを自動化できないかと思い、色々と模索してみることにした。文字データを画像認識技術を使用してデータに起こす際のコスト削減方法を調査、検証する。例えば、効率的な画像処理アルゴリズムの選択や、クラウド上での処理方法をリサーチすることで、コスト削減につなげる視点からのアイデアをまとめる。 仕様今回自動化したい作業のデータ入力は専用のポータルサイトで行うらしい。つまりローカルに何かソ

          AIで自動で日本語の文字認識をしよう!①

          東北大学院入試の指標

          1. 初めに(誰に向けた文書か) この文書は、 東北大学工学部電気情報物理工学科所属、 特に情報コースに所属しており、 工学研究科電気系3専攻 (電子工学専攻、通信工学専攻、電気エネルギーシステム専攻)に進学を目指す方向けの資料です。これ以外の研究科について、また東北大学外部から受験される場合の注意点については全くの門外漢ですのであまり参考にならないかと思います。また、後述しますが受験科目のうち基礎科目の情報基礎1、情報基礎2、数学基礎、専門科目の計算機1、計算機2

          東北大学院入試の指標

          初めまして

          こんにちは。現在東北大学4年に所属しているNOTEという者です。 本noteは主に研究に際して調べたことをまとめるために開設いたしました。 特に画像生成AIに関する事項についてゆるーくまとめていきますのでよろしくお願いいたします。 また、東北大学の大学院入試の体験、対策を有料記事にまとめてありますのでそちらもよろしくお願いいたします。

          初めまして