2、世界上最快而又最慢,最长而又最短,最平凡而又最珍贵,最易被忽视而又最令人后悔的就是时间。3、盛年不重来,一日难再晨。及时当勉励,岁月不待人。4、勤奋的人是时间的主人,懒惰的人是时间的奴隶。5、时间下面是小编为大家整理的2023形容时间快句子【五篇】(2023年),供大家参考。
形容时间快的句子范文第1篇
1、任何节约归根到底是时间的节约。
2、世界上最快而又最慢,最长而又最短,最平凡而又最珍贵,最易被忽视而又最令人后悔的就是时间。
3、盛年不重来,一日难再晨。及时当勉励,岁月不待人。
4、勤奋的人是时间的主人,懒惰的人是时间的奴隶。
5、时间最不偏私,给任何人都是二十四小时;
时间也最偏私,给任何人都不是二十四小时。
6、想成事业,必须宝贵时间,充分利用时间。
7、时间就是性命,无端的空耗别人的时间,其实是无异于谋财害命的。
8、时间是一个伟大的作者,它会给每个人写出完美的结局来。
9、节约时间,也就是使一个人有限的生命更加有效,也即等于延长了人的生命。
10、我认为世间最可宝贵的就是“今”,最易丧失的也是“今”。()因为他最容易丧失,所以更觉得贵。
11、要找出时间来考虑一下,一天中做了什么,是正号还是负号。
12、今日复今日,今日何其少!今日又不为,此事何时了!人生百年几今日,今日不为真可惜!若言姑待明朝至,明朝又有明朝事。为君聊赋今日诗,努力请从今日始。
13、人的全部本领无非是耐心和时间的混合物。
14、时间是一条金河,莫让它轻轻地在你的指尖溜过。
15、钉子是敲进去的,时间是挤出来的。
16、昨天唤不回来,明天还不确实,你能确有把握的就是今天。
18、时间给勤奋者以荣誉,给懒汉以耻辱。
19、古来一切有成就的人,都很严肃地对待自己的生命,当他活着一天,总要尽量多劳动,多工作,多学习,不肯虚度年华,不让时间白白地浪费掉。
20、光阴似箭,日月如梭。眨眼间,时间像一匹飞驰的骏马,从我们的身边飞逝而去,我们的工作像一颗闪耀的金色的光芒的流星一样,结束了。
形容时间快的句子范文第2篇
1、任何节约归根到底是时间的节约。
2、世界上最快而又最慢,最长而又最短,最平凡而又最珍贵,最易被忽视而又最令人后悔的就是时间。
3、盛年不重来,一日难再晨。及时当勉励,岁月不待人。
4、勤奋的人是时间的主人,懒惰的人是时间的奴隶。
5、时间最不偏私,给任何人都是二十四小时;
时间也最偏私,给任何人都不是二十四小时。
6、想成事业,必须宝贵时间,充分利用时间。
7、时间就是性命,无端的空耗别人的时间,其实是无异于谋财害命的。
8、时间是一个伟大的作者,它会给每个人写出完美的结局来。
9、节约时间,也就是使一个人有限的生命更加有效,也即等于延长了人的生命。
10、我认为世间最可宝贵的就是“今”,最易丧失的也是“今”。()因为他最容易丧失,所以更觉得贵。
11、要找出时间来考虑一下,一天中做了什么,是正号还是负号。
12、今日复今日,今日何其少!今日又不为,此事何时了!人生百年几今日,今日不为真可惜!若言姑待明朝至,明朝又有明朝事。为君聊赋今日诗,努力请从今日始。
13、人的全部本领无非是耐心和时间的混合物。
14、时间是一条金河,莫让它轻轻地在你的指尖溜过。
15、钉子是敲进去的,时间是挤出来的。
16、昨天唤不回来,明天还不确实,你能确有把握的就是今天。
18、时间给勤奋者以荣誉,给懒汉以耻辱。
19、古来一切有成就的人,都很严肃地对待自己的生命,当他活着一天,总要尽量多劳动,多工作,多学习,不肯虚度年华,不让时间白白地浪费掉。
20、光阴似箭,日月如梭。眨眼间,时间像一匹飞驰的骏马,从我们的身边飞逝而去,我们的工作像一颗闪耀的金色的光芒的流星一样,结束了。
形容时间快的句子范文第3篇
1、一日无二晨,时间不重临。
2、世人若被明日累,春去秋来老将至。
3、一年之计在于春,一日之计在于晨。
4、劝君莫惜金缕衣,劝君惜取少年时。
5、百川东到海,何时复西归。
6、钉子是敲进去的,时间是挤出来的。
7、昨日复昨日,昨日何其好!今日徒懊恼。世人但知悔昨日,不觉今日又过去了。水去日日流,花落日日少。成功立业在今日,莫待明天朝悔今朝。
8、节气不饶苗,岁月不饶人。
9、时间伟大的作者,她能写出未来的结局。
10、年年岁岁花相似,岁岁年年人不同。()
11、志士惜日短,愁人知夜长。
12、白驹过隙日光荏苒?
13、年难留,时易损。
14、少壮不努力,老大徒伤悲。
15、流水落花春去也,天上人间。
16、惊风飘白日,光景西驰流。
17、皇皇三十载,书剑两无成。
18、朝看水东流,暮看日西沉。
19、人寿几何?逝如朝霞。时无重至,华不在阳。
20、天波易谢,寸暑难留。
21、黑发不知勤学早,白首方悔读书迟。
22、花儿还有重开日,人生没有再少年。
23、不饱食以终日,不弃功于寸阴。
24、人寿几何逝如朝霜。时无重至,华不再阳。
25、一寸光阴一寸金寸金难买寸光阴。
26、时间是一条金河,莫让它轻轻地在你的指尖溜过。
29、时间最不偏私,给任何人都是二十四小时;
时间也最偏私,给任何人都不是二十四小时。
30、明日复明日,明日何其多!我生待明日,万事成蹉跎。世人皆被明日累,春去秋来老将至。朝看水东流,暮看日西坠,百年明日能几何?请君听我明日歌。
31、生事应须南亩田,世情付与东流水。
33、勤奋的人是时间的主人,懒惰的人是时间的奴隶。
34、盛年不重来,一日难再晨。及时宜自勉,岁月不待人。
35、生命如日出日落,岁月蹉跎,时光荏苒,时光一去不复返,往事只能回味,物是人非事事休,岁月不饶人,岁月无情,仿佛还在昨天。
36、少年易学老难成,一寸光阴不可轻。
37、三春花事好,为学须及早。花开有落时,人生容易老。
38、失之东隅,收之桑榆。
39、三更灯火五更鸡,正是男儿读书时,黑发不知勤学早,白发方悔读书迟。
41、青青园中葵,朝露待日晞。阳春布德泽,万物生光辉。常恐秋节至,尡黄华叶衰。百川东到海,何时复西归。少壮不努力,老大徒伤悲。
42、用“分”来计算时间的人,比用“时来计算时间的人,时间多五十九倍。
43、莫等闲,白了少年头,空悲切。
44、今日复今日,今日何其少!今日又不为,此事何其了?人生百年几今日,今日不为真可惜!若言姑待明朝至,明朝又有明朝事。为君聊赋今日诗,努力请从今日始。
形容时间快的句子范文第4篇
2、昔岁逢太平,山林二十年。——元结《贼退示官吏》
3、叹流年、又成虚度。——陆游《谢池春·壮岁从戎》
4、伤心桥下春波绿,曾是惊鸿照影来。——陆游《沈园二首》
5、桃今百馀尺,花落成枯枝。——李白《独不见》
6、去年今日卧燕台,铜鼓中宵隐地雷。——王守仁《元夕二首》
7、华灯纵博,雕鞍驰射,谁记当年豪举。——陆游《鹊桥仙·华灯纵博》
8、最是一年春好处,绝胜烟柳满皇都。——韩愈《早春呈水部张十八员外/初春小雨/早春》
9、四十三年,望中犹记,烽火扬州路。——辛弃疾《永遇乐·京口北固亭怀古》
形容时间快的句子范文第5篇
关键词:快速形式匹配;
BLEU4;
ROUGE_L;
ROUGE_S;
评价
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)19-0162-07
Fast Formal Match and Performance Evaluation Analysis
YU Jun-ting1, LIU Wu-ying2, YI Mian-zhu1, HE Hong-ye1
(1. Luoyang University of Foreign Languages, Luoyang 471003, China;
2 .Language Engineering and Computing Laboratory, Guangdong University of Foreign Studies, Guangzhou 510420, China)
Abstract:
Sentence matching and its evaluation are worth well to research. This paper addresses the languages with natural space separators, proposes a fast formal match algorithm, which wraps characters and takes advantage of character cohesion in word. This algorithm can match the source sentence and target sentence fast at form, improve matching performance effectively and shorten matching time. We perform experiments in bilingual sentence data set and take the BLEU, ROUGE_L, ROUGE_S as evaluation metrics. And the results show that fast formal match can improve the average BLEU4 of traditional Levenshtein match by 12.5% with the 87.6% shortening of the runtime, and the improvement of ROUGE_L"s F value is 17.7% and that of ROUGE_S"s is 16.0%. At the evaluation of sentence matching, ROUGE_L can improve the performance evaluation with greatly reducing time costs, whose performance is the best. And that of BLEU is worse, the ROUGE_S"s is the third one.
Key words:
Fast Formal Match;
BLEU4;
ROUGE_L;
ROUGE_S;
Evaluation
1 概述
句子匹配是指利用计算机算法从句子集合中自动找出与源句子形式、句法、语义相似的目标句子,通常包括浅层形式匹配、句法匹配和深层语义匹配等类型。浅层形式匹配往往不需要复杂的深层标注和手工对齐,计算效率比较高,因此具有更加广泛的适用性。迄今为止,人们提出了很多句子匹配算法。比较这些句子匹配算法的性能极具研究价值。目前主流的句子匹配评价方法就是将评价问题转化为相似度计算问题[1],即针对同一个译文测试集,比较机器输出的候选译文与人工参考译文之间的相似度。例如基于译文中不同长度连续子串计算候选译文和参考译文之间相似度的BLEU评价算法[2],基于最长公共子串计算译文相似度的ROUGE_L评价算法[3][4]以及基于不连续二元子串计算译文相似度的ROUGE_S评价算法[3][4]等。
在已有的相似度计算方法中,传统Levenshtein编辑距离能够语言无关地度量各种句子之间的相似度,广泛应用于各种句子匹配算法中。其中语言无关的优点是基于单个字符实现的,在大数据时代针对特定语言存在进一步提高计算效率的空间。为了应对大数据量、高速率信息处理的需求,我们针对存在天然空格分隔符的语言提出一种快速形式匹配算法,它能够充分利用单词中字符的内聚性提高句子匹配效率。
2 快速形式匹配
传统Levenshtein匹配算法是基于字符来计算两个字符串之间的编辑距离,即将两个字符串序列匹配时需要进行编辑操作(插入、删除和替换)的最少次数[5]。编辑距离越短,这两个字符串的相似度越高;
编辑距离为零,意味着这两个字符串可以完全匹配。而且字符串A和字符串B之间的距离与字符串B和字符串A之间的距离相等。对于存在天然空格分隔符的语言(比如,英语、俄语),传统Levenshtein匹配打破了单词字符之间的内聚性,降低了匹配效率。快速形式匹配算法将字符进行打包,充分利用字符间的内聚性,使源句子与目标句子在形式上进行快速匹配,有效提高匹配性能,缩短匹配时间。
2.1基本流程
对于存在天然空格分隔符的语言,为了提高句子匹配性能,我们通过将字符打包,提出了快速形式匹配算法,基本流程框图如图1所示。
快速形式匹配基本流程图主要包括5个处理模块:LDCalculator、MinLD、SentenceRetriever、EvaluationCalculator和MaxEvaluation。LDCalculator模块接收来自语料库的两个源句子,并计算它们的Levenshtein距离。比如,LDCalculator分别接收句对, , ... , ,通过计算得到Levenshtein距离集合{d12, d13, ... , d1N}。MinLD模块计算Levenshtein距离集合中的最小Levenshtein距离,通过检索语料库得到最小Levenshtein距离对应的源句子集合{ss11, ss12, ... , ss1m}并将其送入SentenceRetriever模块。SentenceRetriever模块将这些源句子集合翻译成目标句子集合{ts11, ts12, ... , ts1m}。EvaluationCalculator模块接收源句子ss1对应的目标句子ts1和目标句子集合{ts11, ts12, ... , ts1m},分别计算每组目标句对, , ... , 的性能评估值集合{EV11, EV12, ... , EV41m}(本文中性能评估值分别为BLEU的BLEU4,ROUGE_L的F值和ROUGE_S的F值)。最后,MaxEvaluation计算性能评估值集合的最大值并输出最大的性能评估值(EV1)。同时,我们记录这一匹配过程的运行时间。这样,我们完成了源句子ss1的流程,语料库中剩余的其他源句子将运行和源句子ss1同样的过程。
传统Levenshtein匹配主要在LDCalculator模块上不同于快速形式匹配。传统Levenshtein匹配中LDCalculator模块的两个输入源句子在字符级进行计算,而快速形式匹配在单词级进行计算。其他部分的实现均相同,并且这两个算法所用到的语料库和其他实验条件也是相同的。
2.2算法
快速形式匹配算法的伪代码如表1所示,主要包含两个main函数:ldcalculate和evaluationcalculate。
当一个源语言文本输入时,ldcalculate函数将语料库中的源语言文本以"\n"为标志切分成源语言句子;
并且计算语料库中每两个源语言句子的Levenshtein距离,即计算句子i和句子j的Levenshtein距离的二维矩阵dij。
然后,通过MinLD模块得到最小的Levenshtein距离以及对应的目标语言句子集合,当源句子ss1对应的目标句子和目标句子集合输入,evaluationcalculate函数分别计算BLEU4值以及ROUGE_L和ROUGE_S的F值。
快速形式匹配算法很好地保持了单词中字符的内聚性,它的时空复杂度主要取决于二维矩阵dij的存储空间和ldcalculate函数的循环次数。理论上来说,快速形式匹配的存储空间分别正比于最长源语言句子中单词数目的平方,而传统Levenshtein匹配的存储空间正比于最长源语言句子中字符数目的平方。快速形式匹配的时间复杂度正比于语料库中源语言句子数目和最长源语言句子中单词数目乘积的平方,传统Levenshtein匹配的时间复杂度正比于语料库中源语言句子数目和最长源语言句子中字符数目乘积的平方。因此,快速形式匹配的空间复杂度为O(w2),传统Levenshtein匹配为O(c2);
快速形式匹配的时间复杂度为O(n2w2),传统Levenshtein匹配为O(n2c2)。其中,n为语料库中源语言句子的数目,w为最长源语言句子中单词数目,c为最长源语言句子中字符数目,w明显小于c。因此,快速形式匹配的时间复杂度和空间复杂度都要优于传统Levenshtein匹配。
2.3 计算粒度选择
为了选取合适的计算粒度,我们在具有4.00GB的内存和CPU为Intel Core i5-2520M的计算机上对快速形式匹配和传统Levenshtein匹配进行了实验比较,并分别采用BLEU、ROUGE_L、ROUGE_S三种指标进行评价,得到各自的性能评估值和运行时间。
首先采用BLEU对语料库中经过去重的俄汉双语对齐平行语料的快速形式匹配和传统Levenshtein匹配的性能进行评价。其中包含52892个俄汉句对,并对其按俄语句子长度进行排序。通过计算语料库中每两个俄语句子的Levenshtein距离得到52892组实验结果(包括最大BLEU4值和运行时间),为方便结果展示,将每1000个实验结果取平均值作为该组的最终结果,得到53组BLEU4和运行时间。同理,分别采用ROUGE_L和ROUGE_S对快速形式匹配和传统Levenshtein匹配的性能进行评价,分别得到53组F值和运行时间。三种评价指标的最终性能评估值(包括BLEU的BLEU4,ROUGE_L的F值以及ROUGE_S的F值) 如表2所示,表3为三种评价指标的运行时间(其中KFM表示快速形式匹配,TLM表示传统Levenshtein匹配)。
从表2中三种不同评价指标所得实验结果可以看出,快速形式匹配的性能明显优于传统Levenshtein匹配的性能;
从具有最大性能评估值的输出相似句子可以看出,快速形式匹配的输出相似句子与源句子具有相似的形式架构,而传统Levenshtein匹配没有此相似度,原因是字符匹配破坏了词的内部结构。
表3运行时间数据中可以看出:1) 同样的实验条件下,传统Levenshtein匹配比快速形式匹配花费更多的时间,例如采用ROUGE_L进行评价时,传统Levenshtein匹配花费的总时间为227502936ms,快速形式匹配仅花费了28057625ms,是传统Levenshtein匹配花费时间的1/8;
2) 快速形式匹配在整个实验过程中最长运行时间与最短运行时间的时间差远小于传统Levenshtein匹配的时间差;
传统Levenshtein匹配的变化趋势比快速形式匹配快,当增加相同的字符时,传统Levenshtein匹配的运行时间增加比快速形式匹配大;
3) 随着句子长度的增加,快速形式匹配的运行时间比传统Levenshtein匹配变化小,传统Levenshtein匹配更容易受到字符数目的影响。
综上所述,在选择计算粒度时,快速形式匹配更适用于存在天然空格分隔符的语言,它比传统Levenshtein匹配更能够提高句子匹配性能,充分利用单词中字符的内聚性,以最小的时间代价获得高效的性能评估值。传统Levenshtein匹配比快速形式匹配更容易受到字符数目的影响,将字符进行打包能够缩短运行时间,提高整体的句子匹配效率。
3 快速形式匹配性能评价分析
3.1 实验条件及语料
实验均在具有4.00GB的内存和CPU为Intel Core i5-2520M的计算机上运行。对快速形式匹配进行实验,分别采用BLEU、ROUGE_L、ROUGE_S三种评价指标对其句子匹配性能进行评价,得到各自的性能评估值和运行时间,并对实验结果进行分析比较。
双语句子数据集采用星汉句库,其中包含新闻领域的52892个俄汉双语对齐句对。这些句子按照俄语句子长度进行排序,并且已经被去重处理,形式上各不相同。
3.2评测
我们分别采用经典BLEU,ROUGE_L,ROUGE_S来评测快速形式匹配的运行结果。
由于BLEU要用到N-gram准确率pN,当参考译文句子过短,比如长度为3时,则4-gram的出现次数为零(即分母为零),为了解决这种零计数的问题,我们对N-gram准确率pN进行修正,如式(1)所示,采用加1平滑技术:分别给候选译文和参考译文中N-gram出现的数目加1[6]。
设定N-gram最大阶数为4,统一权值为wN=1/N。
ROUGE-L把最长公共子串 (Longest Common Substring, LCS)应用到评价算法中,同时避免了BLEU无法捕捉远距离不连续语言单元之间的关系的缺点,将召回率与准确率同时考虑进去,取其F值进行测度。设定参考译文中某个句子X的长度为m,候选译文中的相应句子Y的长度为n,则ROUGE-L的计算公式为:
其中,LCS(X,Y)为X和Y最长公共子串的长度,Flcs为准确率Plcs和召回率Rlcs的调和平均值,即为ROUGE_L的F值,把准确率和召回率同时考虑其中,避免了BLEU忽略召回率的缺点。
ROUGE_S利用Skip-bigram的匹配实现对远距离词汇关系的捕捉,每个句子长度为len的句子都有C(len,2)个skip-bigrams(即不连续的顺序二元组)。类似于ROUGE_L,ROUGE_S的计算公式如下:
其中,SKIP2(X,Y)为参考译文X和候选译文Y中能够匹配的顺序二元组的数目,C(m,2)和C(n,2)为组合公式,Fskip2为准确率P skip2和召回率R skip2的调和平均值,即为ROUGE_S的F值。
3.3 实验结果
由于BLEU、ROUGE_L和ROUGE_S均是基于字符串匹配的自动评价方法,而且是根据候选译文和参考译文的相似度给每一个候选译文分配一个分数。它们的操作原理区别于相似度计算方法的不同:BLEU基于连续N元子串的准确率计算相似度;
ROUGE_L采用最长公共子串的F测度计算相似度;
ROUGE_S采用不连续二元子串的F测度计算相似度,同时考虑了准确率和召回率的影响。因此本文通过对其最终得分的情况评价各自的性能优劣。由表1和表2可以看出,快速形式匹配能够以较小的时间代价获取较高的匹配性能,比传统Levenshtein匹配更适合俄语这种存在天然空格分隔符的语言,因此采用BLEU、ROUGE_L和ROUGE_S分别对快速形式匹配性能进行评价,所得不同句组的性能评估值和运行时间的变化曲线如图3所示。
从图3(a)中性能评估值的变化曲线可以看出,横坐标为句子分组序列号,纵坐标为每个句组的平均性能评估值:(1) BLEU、ROUGE_L和ROUGE_S的性能在整个变化区间上具有相同的变化趋势;
(2) 同样的实验条件下,ROUGE_L的性能最好,BLEU次之,ROUGE_S第三,例如在第13句组中,BLEU4的值为0.31,ROUGE_L的F值为0.40,ROUGE_S的F值为0.19;
(3) 整个数据集上,BLEU4的平均值为0.26,ROUGE_L的F均值为0.31,ROUGE_S的F均值为0.16,ROUGE_L的整体句子匹配性能最优。
图3(b)运行时间变化曲线可以看出,横坐标为句子分组序列号,纵坐标为每个句组运行的平均时间:(1) 将整个语料库中的52892个句对进行匹配并评价,BLEU花费总时间为28409492ms,ROUGE_L为28057625ms,ROUGE_S为31327056ms,ROUGE_L所花费的时间最少,BLEU次之,而ROUGE_S花费的时间要大于BLEU和ROUGE_L所花费的时间;
(2) 整个实验过程的时间分为两部分:Levenshtein匹配时间和性能评价时间,三种评价指标采用的均是快速形式匹配算法,因此在Levenshtein匹配阶段不存在时间差异,而在评价过程中N元子串的查找和匹配阶段时间有不同,寻找最长公共子串的时间最短,效率最高,N元子串匹配次之,不连续顺序二元组的查找与匹配性能第三。
综合上述实验分析,在进行句子匹配性能评价时,ROUGE_L能够以较短的时间获取较高的性能评估值,性能最优,BLEU次之,ROUGE_S性能第三;
通过寻找候选译文和参考译文的最长公共子串比较相似度这一方法具有更高的匹配效率,能够很好地适应大数据时代海量数据高效率检索的需求。
4 结束语
本文研究了快速形式匹配算法及其评价。对于存在天然空格分隔符的语言而言,快速形式匹配能够很好地利用单词字符之间的内聚性,提高句子匹配的效率。而且在评价算法匹配性能时,ROUGE_L能够以较小的时间代价获得较高的匹配性能。在大数据时代,快速形式匹配以及ROUGE_L具有很好的应用优势。
除了浅层形式匹配之外,在下一步的研究工作中我们将引入深层语义匹配,并对句子匹配评价指标的改进进行深入研究。
参考文献:
[1] 王博. 机器翻译系统的自动评价及诊断方法研究[D]. 哈尔滨工业大学,2010.
[2] Kishore Papineni, Salim Roukos, Todd Ward, et al. BLEU:
a Method for Automatic Evaluation of Machine Translation. Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, Philadelphia, USA,2002:311-318.
[3] Lin C Y. ROUGE:
A Package for Automatic Evaluation of Summaries. In Proceedings of the Workshop on Text Summarization Branches Out, post-conference workshop of ACL 2004, Barcelona, Spain,2004.
[4] Lin C Y, Och F J. Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statistics. In Proceedings of ACL,2004.
[5] 米成刚,杨雅婷,周喜,等. 基于字符串相似度的维吾尔语中汉语借词识别[J]. 中文信息学报,2013,27(5):173-179.