离家百年、去国万里,它们回来了。5月18日,“汉典重光”海外古籍数字化回归发布会在中国科技馆举行。一批珍藏于加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地汉典重光古籍平台。借助阿里达摩院的技术,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过汉典重光平台翻阅、检索古籍。据悉,达摩院AI对20万页古籍的识别准确率达到97.5%。
“汉典重光”项目由阿里巴巴公益基金会、四川大学、美国加州大学伯克利分校、中国国家图书馆、浙江图书馆合作开展,旨在寻觅流散海外的中国古籍并将其数字化、公共化,让普通人也能亲近古籍,通过古籍与先贤对话,与优秀传统文化对话。
汉典重光古籍数字化平台
因邦交、贸易、战乱等,历史上中国古籍时有出海,近代以来,战争和动荡更加剧了古籍的损毁和流散。据不完全估计,散居海外的中国古籍超过40万部、400万册,包括甲骨简牍、敦煌遗书、宋元善本、明清精椠、拓本舆图、少数民族文献等等。
2019年,阿里巴巴和四川大学提出“数字化回归”设想,四川大学历史文化学院王果副院长与该院教授、中央文史研究馆馆员陈力牵线搭桥,沟通北美、欧洲、日韩等地藏书机构,获得加州大学伯克利分校支持,达成共识,将伯克利东亚图书馆的中文古籍善本逐步数字化。
加州大学伯克利分校是美国的汉学研究重镇,中文藏书量排名全美第三。首批数字化的20万页古籍中,包含40余种珍贵宋元刻本、写本,如宋刻本《後村居士集》、北宋《金粟山大藏经》写本;明清至时期著名学者钱谦益、翁方纲、王韬的抄本、稿本;著名藏书楼嘉业堂、密韵楼的抄本,还有命运多舛的清文澜阁《四库全书》零本等,很多都是消失多年后重回公众视线的珍本。
文澜阁版《宋百家诗存》(卷七)
伯克利提供古籍的扫描图片和编目数据,达摩院将其全部文字化。古汉语常用字仅有几千,但中国古籍全部字符约有几十万,绝大部分不仅没被现代字库收录,也几乎找不到样本供AI学习。面对海量无标注的数据,如何让AI快速批量识别古籍,始终是古籍数字化领域的技术瓶颈。
达摩院技术团队与四川大学专家联手研发了一套全新的古籍识别系统。利用单字检测、无监督单字聚类、小样本学习、主动学习等机器学习方法,构造了一套边识别古籍、边训练模型的系统,以97.5%的准确率完成对20万页古籍的整体识别。
该系统已能批量识别百本古籍,并沉淀覆盖3万多字的古籍字典。比起专家录入,这套人机交互的识别系统将效率提升了近30倍。随着古籍识别规模的扩增,机器还会自我进化,不断提升准确率和效率。
阿里巴巴达摩院院长张建锋
阿里巴巴达摩院院长张建锋表示,守护中华传世典籍,是科技工作者和文化工作者共同的使命。阿里计划将这套技术工具连同古籍数字化平台一并捐赠,交由权威公共机构长期运营,同时,阿里仍将在古籍数字化工作上持续投入人力物力。
与古籍打了一辈子交道的陈力说,典籍是中华文明的传承载体,更是人类世界的公共财产,希望有更多力量参与中国古籍的保护和传承,让更多普通人有机会接触古籍、使用古籍,让所有蒙尘的古籍重焕新生,让书写在古籍里的文字活起来。
扬子晚报/紫牛新闻记者 徐晓风
附:
“汉典重光”首批数字化古籍重要书目一览
1、周易兼义九卷(魏)王弼(晋)韩康伯注(唐)孔颖达疏 元刻本
2、易附记十六卷[存卷一至十一]书附记十四卷诗附记十卷[存卷一至七]礼记附记囗卷[存卷四至六]春秋附记[缺卷七、九](清)翁方纲撰 稿本,嘉业堂藏书
3、五代史阙文一卷(宋)王禹偁撰 清乾隆南昌彭氏知圣道斋抄本,清彭元瑞跋,嘉业堂藏书
4、瀛壖杂志一卷(清)王韬撰 稿本 清魏彦、左桂、孙瀜、赵烈文题记
5、金石古文八卷(题)双华山人乔辑 清周亮工抄本 清吴骞跋
6、居业录八卷[存卷三至四](明)胡居仁撰 清乾隆文澜阁四库全书本,嘉业堂藏书
7、学思录一卷(封面题东塾存稿)(清)陈澧撰 稿本
8、丙丁龟鉴十卷(宋)柴望撰 天一阁抄本
9、新刊履斋示儿编二十三卷(宋)孙奕撰 明抄本,天一阁、嘉业堂递藏
10、蓬轩类记四卷(明)黄暐撰 明抄本 柯逢时校,汪氏振绮堂、刘氏嘉业堂递藏
11、大般若波罗蜜多经[存卷第二百五十四] 北宋写金栗山广惠禅院大藏本
12、苏文忠公文集[存一叶](宋)苏轼撰 宋四川眉山刻本
13、淮海集四十卷淮海后集六卷(宋)秦观撰 宋乾道九年高邮军学刻宋元明递修本,嘉业堂藏书
14、傅忠肃公文集三卷(宋)傅察撰 清初经鉏堂抄本,曹溶旧藏
15、鹤山先生大全文集一百十卷目录二卷[存卷一至九、九六、九十九至一百零三、一百九十](宋)魏了翁撰 蒋汝藻影宋抄本,密韵楼藏书
16、後村居士集五十卷目录二卷[卷四十六至五十缪荃孙抄配](宋)刘克庄撰 宋刻本,嘉业堂藏书
17、林子真诗一卷(明)林光宇撰 明曹学佺辑 明崇祯韩锡抄本
18、茗柯文编囗编囗卷[存初编一卷三编一卷四编一卷未编稿一卷](清)张惠言撰 稿本 清范当世、近人叶恭绰跋,嘉业堂藏书
19、宋百家诗存四十卷[存卷七](清)曹廷栋辑 清文澜阁四库全书本
20、西清诗话三卷(题)无为子撰 明抄本,嘉业堂藏书
21、拜经楼诗话续编二卷(清)吴骞撰 稿本,嘉业堂藏书
22、玉茗新词四种(明)汤显祖撰 明万历四十六年雕虫馆刻本
来源:紫牛新闻
我们现代人都把“年”和“岁”当做同一个意思,老百姓都习惯说:过一年就长一岁。
其实这是个误解,十二个月这个单位叫“岁”,岁月无情,离离原上草,一岁一枯荣,都是这个“岁”。
农历十二个月,是按照月亮绕地球一周计算,月圆月缺一个轮回就是一个月,再结合地球绕太阳一周,春夏秋冬轮回一次,十二个月,大约360天一周期叫“岁”,这个历法遵从自然规律,在古代主要服务于农业生产。
可是这个历法非常复杂,必须观察太阳月亮运转规律,积累几百年甚至上千年的资料,最后才制定出这个历法,这个时候已经是高度文明了,大约产生于夏朝时期。因此农历又叫“夏历”,这也叫“岁月计时法”。
“日历”出现之前,人们也要计算日期,判定人的大小,那时候没有日历,人们如何计算日期呢?
在此之前用的是“干支”纪年法,“干支”就是“天干地支”,这个“干”就是江河干流的“干”,“支”就是“江河支流”的“支”。
“天干”就是日出日落,一天又一天,这是时间的“主干”,“日出日落”由老天决定的,所以叫“天干”。
我们今天用几月几号来区别,在没有日历的时候,人们又怎么办呢?古人就创造了十个符号:甲乙丙丁戊己庚辛壬癸。
用这十个字来标识一天又一天的区别,例如今天是“甲日”,明天是“乙日”,后天是“丙日”,依次往后排。
甲日、乙日、丙日、丁日、戊日、己日、庚日、辛日、壬日、癸日
等十天排满后再重新开始又一轮,又是:甲日,乙日,丙日……。
远古社会是部落贵族统治,管理庶民奴隶,可能在第七天“庚日”那天休息放假,所以这“十天”轮回就叫“一庚”。
各种时间划分都论“庚”,“十天”是“一庚”,几个十天就是“几庚”,“庚”是最早的时间单位,因此古代人问人多大了,就问:您贵庚了。
除此之外,在一天之中也要有时间划分,原始社会也有工作安排,在一天之内不同的时间段,要做不同的工作,古代没有今天二十四小时划分。
于是古人把一天划分为十二段,用:子丑寅卯,辰巳午未,申酉戌亥,这十二个字为符号来标识,分别为:子时,丑时,寅时,……,等等来标识一天内的时间划分。
子时、丑时、寅时、卯时、辰时、巳时、午时、未时、申时、酉时、戌时、亥时
在一天之中时间划分是时间支流,只是由地上的人决定的,因此叫“地支”。
由于古代人们大都没文化,想要让普通人记住十二个时辰的名称比较困难,于是选取了十二种动物,分别代表一个时辰,于是就有了“子鼠”,“丑牛”,“寅虎”,“卯兔”,等等。
要记住“子时”“寅时”“戌时”比较困难,那就换成“老鼠时”,“老虎时”,“狗时”,这就非常容易了,即使没文化的人也能分清时间点。
当然这十二种动物的安排也不是胡乱设置,在某个时辰内,哪种动物比较活跃,就用它来表示,例如子时(23点至1点),这时老鼠最活跃,就用老鼠表示子时。
戌时(19点至21点),狗开始看家,因此用狗表示。其他也都是如此。
“天干计时法”是中国最古老的计时方法,甲乙丙丁,戊己庚辛,壬癸,十天一轮回,这样粗放式划分也会出现问题。
因为每十天就会出现一个“甲日”“乙日”“丙日”,……,循环周期太短,时间一长很容易混淆。
比如,你记录“甲日”做了什么事,十天后又出现一个“甲日”,“十天之中”自然环境并没有明显变化,在原始社会没有纸,没有笔,甚至连甲骨文也没出现之前,全凭脑子记,经常会记错。
这件事究竟是前一个“甲日”还是后一个“甲日”?如果经常出错就会闹出很多矛盾,破坏生产秩序。
于是古人又想出一个办法,把“天干”十个符号,和“地支”十二个符号,结合起来使用,用两个字标识“一天”。
这就变成了“甲子日”,“乙丑日”,“丙寅日”,到了第十一天是“甲戌日”,虽然有“甲”,但是“甲子日”和“甲戌日”并不重复,可以继续往后排。
因为“十”和“十二”的最小公倍数是“六十”,这就形成了“六十天”一轮回,每六十天才出现一个甲子日,这个循环周期就很长了,如此一来就不会再记错日子。
六十天就是现在说“两个月”,自然环境会发生了巨大变化,如果3月1日是甲子日,那下一个甲子日已经到了4月30日。
虽然都是“甲子日”,可前一个“甲子日”是初春,后一个“甲子日”是初夏,这两个日子肯定不会混淆。
这“六十天”轮回叫“一年”,“十天”为“一庚”,“六十天”为一年,这是中国人最古老的计时方法,所以人的大小都叫“年龄”,或者问“您贵庚了?”
“干支”计时法产生于原始社会早期,当时给人们生活带来了很大便利,但是随着社会发展,它的缺点也逐渐凸显出来。
“干支计时法”只是机械的把日期划分为六十天“一年”,跟大自然春夏秋冬,四季转换没有任何关系。
同样是一年,有的是冬天。有的是春天,还有的是夏天。“年”的变化跟自然气候规律完全脱节,无法服务于农业生产。
中国自古就是农耕经济,春天播种,秋天收获,夏季穿单衣,冬季穿棉衣,人们必须要掌握季节变化规律,“干支计时法”无法满足这些需求。
于是古人又开始观察太阳月亮各种星星的运转规律,古人发现月亮圆缺变化很有规律,于是把月亮30天圆缺一轮回,定为“一个月”。
太阳临近头顶时,就是炎热季节,当太阳偏向南方时就是寒冷季节,再结合星星变化,将太阳运转一轮回分为二十四个节气,约合十二个月,这一个周期叫“一岁”。
这个周期循环顺应自然规律,分为春夏秋冬四个季节,反复出现,每逢初一肯定没月亮,每逢十五必然月亮圆满。
“立春”以后开始温暖,“立夏”非常炎热,“立秋”以后粮食收获,“立冬”以后严寒必然会来临。人们按照规律安排农业生产,极大方便了人民生活。这就是“岁月计时法”。
由于“岁月计时法”顺应自然规律,方便农业耕作,极大促进了农业生产,人们完全接受了这种历法,以六十天为一年的“干支计时法”慢慢被废弃了。
但是“年”的称呼却继续流传,人们后来就把“一岁”也叫“一年”,年和岁逐渐混为一体,就形成了今天的:一年十二个月360天的概念。
今天说的“年”实际都是“岁”,和最早的年完全不同。
因此我们看原始社会很夸张,经常出现某人活了300年,500年,实际300年就是“五十岁”,500年也就是83岁。
据说彭祖活了八百年,很多人感觉这就是神话,实际这个八百年就是八百个“六十天”,折合今天130岁,“八百年”可能是个虚数。
所以彭祖就是个百岁老人,在远古时代能活一百多岁虽然很罕见,但是也肯定真实存在过。
还有大禹治水十三年没回家,其实这“十三年”就是十三个“六十天”,现在说就是两年多。
在大禹生活的时代,人平均年纪才二三十岁,如果按今天说的“十三年”,那就是半辈子。
大禹不可能半辈子不回家,在大禹生活的时代,“十二个月”一岁这个历法可能还没有出现呢。
由于“年”和“岁”概念完全不同,在古代典籍中很多地方叫“岁”,比如《史记 项羽本纪》:(项羽说)吾起兵至今八岁矣。
《汉书》:(苏)武留匈奴,凡十九岁。
宋朝时给西夏辽国定期送物品叫“岁币”。直到清朝统计财政叫“岁入”“岁出”。
因此在历史学研究中,凡涉及远古时代的历史,一定要把“年”和“岁”分清楚,千万不能混为一谈。
年是年,岁是岁,“一年”是六十天,“一岁”是“十二个月约360天”,二者不能通用。
因为一天分为12个时辰,每个时辰两个小时,这个分段也太粗放,随着时代进步,要求时间越来越精细。
于是古人又把一天十二个时辰分为六十刻,也用“甲子”“乙丑”“丙寅”等六十个符号标识,平均每个时辰为五刻钟,每刻合今天的24分钟。古代处决犯人大都选在午时三刻,就是现在的中午12点12分。
因为古代没有今天2010年,2012年这种排列,为了区别年份,人们又把“甲子”“乙丑”“丙寅”等这六十个符号用来纪年,于是又出现了“甲子年”,“乙丑年”“丙寅年”等等。
六十年轮回一甲子,只要活到六十岁,你肯定会经历一个甲子年,所以人们习惯把六十岁叫做“花甲之年”。
古代老百姓没文化,很难记住什么“甲子年”,“乙丑年”之类,于是又用“地支”十二种符号所对应的动物来表示,例如,凡带“子”的年份都是“鼠年”,带“丑”的都是“牛年”,每十二年一个轮回。
这样没文化的人只需要记住自己属什么,就可以推算出年龄大小,极大方便了群众生活。
古人还把每个月也用“甲子”“乙丑”“丙寅”等等,这六十个符号来标识,循环往复。一个人出生时间:年,月,日,时,每个都是“两个字”,加起来正好“八个字”。
比如一个人可能出生于:“甲子”年,“乙丑”月,“丙寅”日,“丁卯”时,古代把这叫做“生辰八字”。算命先生经常用到,可没什么科学依据。
~~~~~~~~~~~~~~~~~~~~~
原创作品 侵权必究 作者:徐保勇
丙火在天上闪烁,普照大地,在天上是太阳是闪电,在地上是炉火是治炼之火,因此称之为阳火。丙火属于太阳火,有文明之象。但凡日干丙日的人,出生在冬夏不如春秋好,这是因为春阳有暖万物之功,秋阳有烘燥万物的作用,冬阳阴晦,夏阳炎热之故。五行颜色:红
丙火所对应物象:为太阳、冶炼场所,引申为城门、祠堂、宫室、窑灶、风景区、游乐场所、早地、剧场等等。
丙火所对应身体:小肠、肩、眼目、心血系统等
丁火
丁火是万物精气,呈文明的气象,在天上是闪烁的群星,在地上是忽明忽暗的灯火。当太阳丙火落下时,于是星光就在天空显现出来,灯火也会明亮起来,丁火属于阴火,只有到了晚上才会辉煌灿烂。凡是日干为丁火的,喜欢生在秋天和夜里,这是因为秋天和夜里正是星光当令的时候,日逢丁火的还喜欢行身弱地,这才符合丁火的性质,五行颜色:红
丁火所对应的物象:为星火、星光、灯火、蜡烛、火把、火炬、引中为厨灶、后门、小门、香火等等
丁火所对应的身体部位:心、眼目、心脏心血系统等