jupyter沈黙中

ただいま、使っているエディタがjupyternotebookなんですが、printで出力しても返してくれない、沈黙中です。どうも困ってるhuloです。

上記のような理由のため、コードは書いたけどエラー出るだろうし、欲しい結果が出るとは限らないので、ご了承を。途中でやめようかと思ったけど、コード書くだけ書いといて、明日にでもまとめて確認&修正していけばいいやとか思ってます。明日は原因追及及び課題修正がメインですね。進めれたら直義って感じですね。ちなみにvscodeやターミナル上でコピペして実行してみたんですが、どちらもなんにもかえしてくれなかったです。あせあせ

今日のコードメモ

import json
import csv
import numpy as np
import pandas as pd
def count_df(courses,vocab):
    df={}
    for word_id, word in enumerate(vocab):
        count=0
        for c in courses:
            if word in c:
                count+=1
        df[word_id]=count
    return df
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
print(len(df)) #コースの中にキーワードが何回入っているか辞書で返す 

import numpy as np
def count_df(courses,vocab):
    df={}
    for word_id, word in enumerate(vocab):
        count=0
        for c in courses:
            if word in c:
                count+=1
        df[word_id]=count
    return df
def lec_word_tfidf_matrix(courses, vocab,df):
    lec_word=np.zeros((len(courses),len(vocab)),dtype=int)
    for i in range(len(courses)):
        for j in range(len(vocab)):
            les_word[i][j]=courses[i].count(vocab[j])*np.log(len(courses)/df
    print(lec_word)
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
lec_word_tfidf_matrix(courses, vocab,df) #tfidfを調べてリストに入れる 

import numpy as np
def count_df(courses,vocab):
    df={}
    for word_id, word in enumerate(vocab):
        count=0
        for c in courses:
            if word in c:
                count+=1
        df[word_id]=count
    return df
def lec_word_tfidf_matrix(courses, vocab,df):
    lec_word=np.zeros((len(courses),len(vocab)),dtype=int)
    for i in range(len(courses)):
        for j in range(len(vocab)):
            les_word[i][j]=courses[i].count(vocab[j])*np.log(len(courses)/df
    return lec_word
def cos_sim(vec1,vec2):
    return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))
def find_similar_course(target,matrix,courses):
    similar_courses = {}
    for i, course in enumerate(courses):
        if i != target_index:
            similarity = 1 - cos_sim(courses.index([title],matrix[i])
            if similarity > 0:
                similar_courses[course] = similarity
    
    print(similar_courses)
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
matrix=lec_word_tfidf_matrix(courses, vocab,df)
title="医学データの統計解析実習"
find_similar_course(courses.index([title]),matrix,courses) #cos類似度の近い数値の要素を取りだす 

書かないといけないコードの内容が難しくなってきてAI様様て感じです。明日はコードのチェックしてもらえたらコメントでフィードバックしてほしいです。

この記事が気に入ったらサポートをしてみませんか?