📦 データセット読み込み

from datasets import load_dataset

# Hugging Faceからデータセットをダウンロード
dataset = load_dataset("Atsushi/fungi_indexed_mycological_papers_japanese")

# データセットの構造を確認
print(dataset)

# 最初のデータを表示
print(dataset['train'][0])
取得されるデータ:
• タイトル(ja_title_provisional_translate)
• タグ(tags)
• 3行要約(R3summary_1, R3summary_2, R3summary_3)
• 種名リスト(species_list)

約5,000件の論文データが取得できます。