名称: /chinese-poetry/chinese-poetry 地址: https://github.com/chinese-poetry/chinese-poetry fork: 8,358 star: 40,920 开发语言: JavaScript 项目简介: The most comprehensive database of Chinese poetry 最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近 5.5 万首唐诗加 26 万宋诗. 两宋时期 1564 位词人,21050 首词。 为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝,也深深烙在了每个中国人的灵魂中。可能某个场景下,随口就能来两句诗词,比如金榜题名或者中了彩票 ,就可以来句“春风得意马蹄疾,一日看尽长安花”,或者好友分别之后,长时间未能再次相见,“桃李春风一杯酒,江湖夜雨十年灯”,更能表达出此时的心境。 最美不过古诗词。因此我们应该将这些瑰宝传承下去,让更多的人看到这些宝藏。虽然这些古典文集,部分已经有了纸质书,但是从某种意义上来说,这些庞大的文集离我们很近,又很遥远。虽然书可能就在傍边,却没有多余的精力去阅读,只能感叹句“有余于心,而力有所不逮”。 在信息化的时代中,电子版更加方便阅读和共享,所以 chinese-poetry 开源数据库诞生了。chinese-poetry 数据库通过 JSON 格式分发,也方便进行二次加工利用。 庞大的数据量,可以用来做什么? 我们都知道,作词需要用到词牌名,宋朝有那么多词牌名,那么使用最多的词牌有哪些呢?有了这些庞大的数据量,我们就可以利用jieba 分词、wordcloud 绘制词云图,一目了然地就可以看到“浣溪沙”是使用最多的词牌,“水调歌头”排在第二。 END
© 版权声明
博主的文章没有高度、深度和广度,只是凑字数。利用读书、参考、引用、抄袭、复制和粘贴等多种方式打造成自己的纯镀 24k 文章!如若有侵权,请联系博主删除。
喜欢就点个赞吧