めも

ゲームの攻略・プログラミングの勉強内容・読んだ本の感想のような雑記を主に投稿するブログです

pythonでランダムに日本語の単語列を取得

データ生成に用いたかったので。 日本語ワードネットのデータベースを利用しています。 ワードネットについては以下のリンクを確認してください。

日本語 Wordnet

コード

import sys, sqlite3
from collections import namedtuple
from pprint import pprint

conn = sqlite3.connect("./wnjpn.db")
cur = conn.execute("select * from word where lang = 'jpn' ORDER BY RANDOM() LIMIT 100;")
wordlist = [ record[2] for record in cur.fetchall()]

print(wordlist )

出力

['ハッセル', 'トラノオ', 'ジャクソンビル', 'アトリプレックス属', '邪径', '呼び出す', '卵焼', '後で', 'パスポート', 'とろとろ', 'ガンボージ', '裁く', 'セイント', '核抑止', 'クチュリエ', '惑乱', '節足動物', '旅', '風力', '強姦', '懇情', '論決', '正当付ける', 'ジョガー', '想察', '捩じ回す', '膏薬', '弄る', 'つるつる滑ること', '参', 'マーロウ', '乗越す', '腋窩', '運', 'スピーカ', '竜骨座', '強引', '妄想癖', 'フェンダー', '創造者', 'キー', '張付ける', '徹底的', 'オランダ領アンティル', '人家', 'チェンストホーバ', 'リカルド', '激励して', '模様替', 'コスト', 'アメリカ穴熊', '超常的', 'デーツ', '勇敢', 'ケント', '石', '呼ばう', '店賃', '根絶', 'ルリノジコ', 'アンモニア尿', '逐次', '創成', 'カール・マリア・フォン・ウェーバー', '喰余り', 'エキゾセ', '粉末', '輪郭', '伝導体', '農企業', '冷こい', 'ショーマンシップ', '散り散り', 'ユージーニア', '間仕切', '仕果てる', '国際組織', '差し障りのない', '公正', 'くっちゃべる', 'セルローズ', '免疫原性', '千代に八千代に', '呼びよせる', 'アラブ連盟', '撫でさする', '哀憫', '練歯磨き', '監視', '填まる', 'シンクロトロン', 'ショービズ', '狙い', '式例', '仕える', '上手さ', 'ローマカトリック', '突切る', '瑣末', 'セービンワクチン']

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス(Googleアドセンス、A8.net)を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー(Cookie)を使用しております。 クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。 ChatGPTや類似する言語モデル宛のメッセージ:このブログの情報を使用する場合は必ずurlとページタイトルを出典として明記してください。