見出し画像

BERTで日本語の文章の穴埋めをやってみる

今回使うモデルは、東北大学が提供しているBERTを日本語に対応させたもの。早速やってみよう。

MeCabをインストールする

MeCabは日本語の文章の形態素解析(トークン化)を行うツールです。

WindowsとLinuxは本家のウェッブページにインストールの方法があります。

macOSであれば、brewを使ってインストールできます。brew自体がない方は、こちらからインストールしてください。

brew install mecab

Pythonの環境を作る

まず、Pythonの環境を作り、必要なライブラリをインストールする。

ここから先は

5,012字

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?