人気の記事一覧

名刺読み取りアプリの検証

1か月前

GPT-4Vのマルチモーダル機能を利用してオセロゲームを生成させた話

3か月前

画像ファイルの文字を認識するプログラムをChatGPTに教えてもらったら、1時間で実装できた

5日前

🌈xAIのGrokが「Grok-1.5V」にバージョンアップとイーロン・マスク氏が発表 同社初のマルチモーダルで画像認識ができるようになったようね 他社のAIと比べても優れてるっていう話 その真相はちょっとどうかしら?って思うけど

MiniGPT4-Videoで動画理解の時代へ

OpenAIが強力な言語モデル「GPT-4 Turbo with Vision」のAPIを一般公開

2週間前

はじめての特許出願【デジタルアーカイブの取り組み】

Claude3 Visionを使ったStreamlitアプリを50行で実装する

『ChatGPTがついに「見る」「聞く」「話す」を習得。世界中のモノの品質が上がる革命』~【新しいweb3ビジネスのアイディアのタネ】2023.9.27

【丸パクリOK!!】AI×YouTubeでバズる動画を量産する方法!!

麻雀初心者救済アプリ「麻雀サポーター」ご紹介!

3か月前

Chat GPTの画像認識でオフィス診断をしてみた。ゴチャゴチャのオフィスの問題点を指摘!https://youtu.be/kca1cZ6AJ6Q

Azureサービスを用いた画像認識の検証

7か月前

Vision Transformer(ViT)の革新性とビジネスへの応用

マシンビジョンエンジニア(マイスターエンジニアリング)・新卒入社若手社員インタビュー Vol.1『カメラ機器のスペシャリスト!マシンビジョンエンジニアの働き方』

画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

3か月前

視界を広げるテクノロジー: 画像認識の魅力を再発見

2か月前

【ChatGPT】ついに目を開くGPTさん【GPT-4V】

イーロン・マスク率いるxAI、画像認識機能搭載のマルチモーダルAI「Grok-1.5V」が空間認識能力で他モデルを凌駕!

12日前

GPT-4Vの性能テストと様々な活用方法

6か月前