FreeStyle: Lyrics Generation via GAN (in progress)

运行实验的方式：

从网易云下载处理过的数据：data.json（这是运行extract.py的结果；这一步环境比较难配，要编译C什么的所以可以直接拿结果来做下一步）
构建词典：python build_dict.py
提取连续区域：python chunking.py，主要的输入参数是词表长度
训练autoencoder:

python train_ae.py --data_file chunks.json --dict_file vocab.txt --outf ae --batch_size 64 --split 0.1 --log_interval 100 --cuda

训练GAN:

python train.py --data_file chunks.json --dict_file vocab.txt --ae_model output/ae/autoencoder_model_5.pt --ae_args output/ae/args.json --outf gan --batch_size 64 --log_interval 200 --updates 200000 --cuda

生成少量歌词：

# 从单个模型生成
python generate.py --ae_args output/ae/args.json --gan_args output/gan/args.json --vocab_file output/ae/vocab.json --ae_model output/ae/autoencoder_model_5.pt --g_model output/gan/gan_gen_model_11.pt --d_model output/gan/gan_disc_model_11.pt --data_path chunks.json --dict_file vocab.txt --noprint --seed 1111 --ngenerations 50 --outf generated/11.txt
# 从保存的模型批量生成
bash gen_evolution.sh

生成大量歌词

# 从训练数据中抽样起始句（或替换为从另外的源抽样起始句）
python sample_quiz.py 
# 读取模型根据给定的起始句生成
python answer_quiz.py --quiz_file quiz.json --ae_model output/ae/autoencoder_model_5.pt --g_model output/gan/gan_gen_model_99999.pt --d_model output/gan/gan_disc_model_99999.pt --outf answer.json
# 或读取一批模型批量生成
bash quiz_evolution.sh
# 计算BLEU score
python engine.py # 预先建立搜索引擎加速BLEU计算
python bleu.py --inputf answer.json --outf bleu.txt
# 计算押韵的分数
python rhyme.py

目前项目的文件结构还比较混乱，近期会修复。

目前主要需要补充的部分：

生成部分的代码：将LM和Beam Search融合进来；连续多句的生成
autoencoder使用整句的EM和F1（而不是孤立地看每个词）作为衡量标准

其他可以补充的部分：

用于展示的简单UI

未来需要扩展的部分：

读取多句context的模型构建/整首歌生成的模型
和音频的数据接合

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
extra_dict		extra_dict
lda_evaluate		lda_evaluate
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
ae_evolution.sh		ae_evolution.sh
answer_quiz.py		answer_quiz.py
bleu.py		bleu.py
build_dict.py		build_dict.py
chunking.py		chunking.py
crawler.py		crawler.py
engine.py		engine.py
eval_ae.py		eval_ae.py
extract.py		extract.py
gen_evolution.sh		gen_evolution.sh
generate.py		generate.py
models.py		models.py
netease_extract.py		netease_extract.py
quiz_evolution.sh		quiz_evolution.sh
rhyme.py		rhyme.py
sample_quiz.py		sample_quiz.py
train.py		train.py
train_ae.py		train_ae.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FreeStyle: Lyrics Generation via GAN (in progress)

About

Releases

Packages

Languages

DeeChat/FreeStyle

Folders and files

Latest commit

History

Repository files navigation

FreeStyle: Lyrics Generation via GAN (in progress)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages