大家好,今天小编关注到一个比较有意思的话题,就是关于下载火星文的问题,于是小编就整理了4个相关介绍下载火星文的解答,让我们一起看看吧。
火星文是什么?
"火星文"大多由汉字中的生僻字、异体字、繁体字以及韩文、日文、符号组成,有时还夹杂着外来语和方言,不仔细琢磨根本看不明白。由于大多数字体不常见,网友只能通过文字的偏旁或字形猜测其意,因此有网友将此类文字戏称为“火星文字”,也有人斥之为“脑残体”。
在QQ空间、论坛以及一些网络游戏内均有不少玩家,大量使用这些符号作为个人签名、简介以及聊天字体。
哪个手机输入法可以打出火星文?
所谓【火星文(火星文:焱暒妏)】,趣指地球人看不懂的文字。由符号、繁体字、日文、韩文、冷僻字或汉字拆分后的部分等非正规化文字符号组合而成。是互联网上年轻网民为求彰显个性,开始大量使用同音字、音近字、特殊符号来表音的文字。
这种文字与日常生活中使用的文字相比有明显的不同并且文法也相当奇异,被称为火星文,趣指地球人看不懂的文字。多元输入法(多元汉字与图形符号输入法)能输入上述所有字符,故能打出所有“火星文”的字符。但多元汉字与图形符号输入法现受国家发明专利保护,暂不提供下载或销售,期待有实力的公司面向全球推广应用。
火星文是怎么回事?
能。
只要能把火星文复原成正常的文字,后续的理解、翻译等等都可以用现有的技术来做。而把火星文复原成正常的文字,可以用与语音识别相同的方法。
语音识别中最核心的方程是:
其中,W代表单词或字符序列,X代表波形,P(W)是字符序列W本身的概率,P(X|W)是字符序列产生波形X的概率。通俗地讲,这个方程说的是,给定波形后,我们要找的字符序列既要本身像话,又要跟观察到的波形相匹配。
把这个方程中的X换成火星文的字符序列,就可以解决复原火星文的问题了。也就是说,给定一个火星文序列,我们要找一个正常的文字序列,它既要本身像话,又要跟火星文相匹配。
方程中的P(W)和P(X|W)两项是需要训练的。
在语音识别中,前者称为语言模型,可以用大量的文本来训练;后者称为声学模型,可以用大量的文本与相应的波形来训练。
在火星文识别中,语言模型不变,我们只需要重新训练与“声学模型”对应的部分。
我们当然可以收集大量的正常文本与火星文本对照的数据,用纯统计的方法来训练。
但我们也可以往里加一些“智能”——比如我们知道“吥”“怀”“杯”“坏”的右边都是“不”,“卜”“卟”“布”等字都念bu,所以这些字在火星文中都可以代表“不”字。
为此,我们需要有关汉字读音和字形的数据库。
Unihan數據庫
中有关于字音的信息,但我还不知道有什么包含字形信息的数据库。谷歌翻译之类的工具翻译不了火星文,非不能也,实不为也。
火星文指什么?是什么意思?
异体火星文,则只是借助一些工具,将汉字转换成形似或者音似的繁体字/异体字,一般的异体火星文即使没接触的人也大体可看懂,比如:
烸兲爱伱哆┅点(中译:每天爱你多一点)
通过工具将简体字转换成不常用的异体字,但大致上通过上下文可以猜出原意。之所以有人喜欢使用这种异体火星文,更多的反映了未成年年人的叛逆心理,这种火星文,可以说没有什么创意,大多是通过工具机械的转换而来,如果说符号火星文的使用显出使用者的一种机智,那么异体火星文仅仅反映出使用者的懒惰。这种标新立异,漠视常规,是典型的叛逆心理。
这种“异体火星文”几年前就作为一种游戏用语在泡泡堂流行,接着又通过QQ资料,QQ签名快速散播。
对于异体火星文,有很多反对者,他们把异体火星文称为“脑残体”。
到此,以上就是小编对于下载火星文的问题就介绍到这了,希望介绍关于下载火星文的4点解答对大家有用。