科普丨ఠ_ఠ 你把人家的字母当成表情用?老外也没有放过汉字

我们为什么喜欢

网上聊天、发朋友圈和微博?

至少文字君认为

很大一部分原因是因为

有各种表情符号、颜文字(Emoji)

乃至人民群众喜闻乐见的表情包

在一个用0和1构成的数码世界

没有表情包根本不能聊天好么……

实际上,很多互联网特色的表情

反而传递了更多更生动的情感

进可战斗,退可卖萌

实在是太好用了

(表情包占了2、3个G

现实生活中的面瘫

你们躺枪了么?)

在表情包和表情符号诞生之前

我们 只能用字符来表示情绪

于是有了很多

虽然线条简单、但却萌力爆表的字符表情

(Emoticon,和Emoji不太一样)

——但你知道这些符号都来自哪里吗?

(·д·),(ノ°д°)ノ

这么惊讶是在干什么?

这个惊讶的“嘴”д

西里尔字母 (Kirillica)的一部分

读音是De

俄语、塞尔维亚语、哈萨克斯坦语

都用的是西里尔字母

(=^ω^=)

这个圆圆的兔唇ω

如果把它单拿出来

可能很多人也认识

它是希腊语里面的“欧米茄”(Omega)

希腊字母表里面的最后一个字母

物理里面用大写的它Ω表示电阻

而惊慌脸

(°Δ°)

里面的三角形Δ

“德尔塔”(Delta,小写是δ)

初中数学里面是方程根的判定

/希腊字母表。图片来源:Wikipedia/

很多你觉得稀奇古怪的字符

实际上是另外的书写体系的一部分

我们所熟知的现代西方大部分语言

都是用拉丁字母拼写的

(有的带有个别的特殊字符和变音符号

例如德语字母上面的“眼睛”)

要说的话

古老的希腊语可是拉丁字母和西里尔字母的“妈”

灿烂的古希腊文明孕育出了最早的数学和哲学

而在文艺复兴以后的现代科学发展中

简洁又意蕴深刻的希腊字母

也被频频用作数学和物理中的符号

算是 西方学术界的一种传统

西里尔字母用希腊语字母改写

得名于向斯拉夫蛮族们传教的圣人西里尔

这套字符通行于斯拉夫语族大部分语言

曾经苏联用它进行“民族语言改造”

更扩大了它的势力范围

(例如哈萨克语属于突厥语系

也使用了西里尔字母)

/斯拉夫民族使用的西里尔字母表。图片来源:Wikipedia/

以上这几个字母

仅仅是我们颜文字考据的入门第一步

而之后……你根本想不到

我们都用了多么遥远的语言来表达情绪!!

如果说西里尔字母和希腊字母还能算混个脸熟

下面的这些符号

就有点 “是不是专门为表情包设计的” 嫌疑了

比如

(ღ˘⌣˘ღ)

这真的不是桃心么?!

ლ(╹◡╹ლ)

这真的不是手指么?!

其实,这是格鲁吉亚的文字“骑士体”

分别念做ghani和lasi

但却圆滚滚的萌萌的呢

格鲁吉亚文由他们的民族先祖创制

有人推断是学希腊文字而来

但正本之源却一直没有定论

最早的格鲁吉亚文出现在公元400多年

这套独特的文字和高加索山里的民族一样

拥有古老而独特的历史

/(作者随手截图的)格鲁吉亚文。图片来源:Wikipedia/

至于像:

(ง •_•)ง

这个捏拳的姿势

还有

(ฅ• . •ฅ)

举“爪子”

来自弯弯扭扭的泰文

这个(ಥ_ಥ)

流泪的怨念之眼

和(ಠ_ಠ)

这个皱眉的大眼睛

来源是卡纳达文

这两个稀奇古怪的文字系统

都来自一个大的文字系统之母

—— 婆罗米文字

/印度孔雀王朝的阿育王流传下的石刻诏书

就是用婆罗米文写就的

图片来源:Wikipedia/

在公元前3-4世纪

盘踞在印度半岛的强大的“孔雀王朝”

使用的就是婆罗米文字

而这种文字派生出了多种文字系统

例如泰文、天城文(印地语使用的文字)

古吉拉特文、僧伽罗文、泰米尔文

甚至还有藏文

多流行于南亚和东南亚

这些风格各异的符号

大家可以感受一下……

/一些婆罗米系文字的辅音。图片来源:Wikipedia/

不过,要往上追溯的话

婆罗米文字

是由一种古老的闪族文字 “阿拉米文” 演变而来

阿拉米文跟腓尼基文血缘甚近

都来自原始的迦南字母

前面提到的拉丁、西里尔字母的妈——希腊字母

也来自腓尼基-迦南书写体系

晕了吧?一句话总结

上面出现的所有稀奇古怪的字符

都有一个同样的祖宗

/上文中提到的婆罗米文字

拉丁、西里尔字母

还有它们的妈希腊字母

都来自腓尼基-迦南书写体系

图片来源:Wikipedia/

还有更稀奇的

像:ᕙ(˵ ಠ vಠ ˵)ᕗ

这里面两个“举拳”的符号

以及奔跑的小人:ᕕ( ᐛ )ᕗ

实际上来自

北美的 一个原住民部落纳斯喀皮人 (Naskapi)

他们使用文字的方向表示不同的元音读音

神奇吧!

/纳斯喀皮文字的读音。你找到ᐛ了吗?图片来源:Wikipedia/

既然我们的表情用了别人的语言

那别人的表情岂不是要用我们的?

当然啦!

比如,在英国的西汉姆球迷中

许多的推特名都带着 “父”

文字君百思不得其解

直到我看到了他们的队徽……

/果然是个自带爹的队徽啊……图片来源:whufc.com/

(́一◞౪◟一‵) 我服了

你们随便用吧

不仅仅是歪果仁借用我们的符号

中国网友们也在重定义着自己的文字

比如人民群众喜闻乐见的“囧”

现在看到之后都会条件反射出一张“囧脸”

恰好读音又是“窘迫”的“窘”字

简直就是完美的文字表情

实际上,“囧”原意为光明

《说文解字》里解为 “窻牖麗廔闓朙”

别看一个字你都不认识

但都是与采光的窗户有关的

囧本身是个象形字

/“囧”字的甲骨文形式

是不是少了一些囧感?

图片来源:Wikipedia/

若一定要说表情丰富的象形字

“观”字的甲骨文和金文要更生动一些

瞪着大眼睛警觉的即视感

/左边第二个字就是金文的“观”

整幅字是“听鸟观鱼”

图片来源:网易网友“风之行”博客/

其实这也没有什么值得奇怪的

不就是强行象形嘛

汉字天生就有很多象形字

被老外拿去那是再正常不过。比如:

( ^_^)o自自o(^_^ ) 代表碰杯

(╬ ಠ益ಠ) 代表极度厌恶

ヽ(o`皿′o)ノ代表愤怒

凸(`0´)凸代表竖中指

川´・ω・`川 代表熊(的毛)

(个_个) 代表眼睛

((( ̄へ ̄井)代表不爽

♪(((#^-^)八(^_^*)))♪ 代表high five

(〃’▽’)_中☆{{{Д}}} 代表拿锤子敲

(oT-T)尸 代表举白旗,如此等等……

等等,这怎么看起来这么别扭啊……

别扭就对了!

因为你已经知道这些字的“含义”

这些含义和它的外形存在了冲突

实验心理学有一个经典成果叫 “斯特鲁普效应”

像这样:

红 黄 蓝 绿

■ ■ ■

是不是很困扰?

是不是看到第一个字

总是想念“红”

而不能正常地念出墨水的颜色“绿”?

斯特鲁普发现

被试要花很久才能成功念出第一组的墨水颜色

而第二组没有困难

反过来,如果让被试念出字本身的内容

那么用什么墨水就无关紧要了

看起来, 当我们阅读一个字的时候

它的含义是“优先”的

我们会先自动读出它的意义

然后才想起来实验员的要求

努力把它纠回去

我们作为汉语母语使用者

阅读汉语表情文字遇到的就是这样的问题

而在表情文字里

这样正好能让我们识别出它的象形含义

好了,说完了文字

我们再来说表情符号的另一个重要来源:

特殊符号

前一阵子非常流行的

(╯‵□′)╯︵┴─┴

掀桌表情

(对,如果你用的是 搜狗输入法

输入“掀桌”二字即可出现)

那个“桌”

实际上就是特殊符号的一种

——表格符号

在稍微有些时日的DOS系统里面

人们只能使用纯文本

那么碰到图和表格怎么办呢?

于是

人们加入了一些特殊符号来满足这个需求

但是往哪儿加这些符号呢?

一开始

人们在电脑上用的是一套叫做ASCII

(读作“阿斯克”

American Standard Code

for Information Interchange

美国信息交换标准代码 )的编码系统

主要用于显示英语和常用的标点

于1967年发布、1986年更新

一共只有128个字符

(其中有95个是可以显示的

剩下的都是“控制符”)

算上大小写、数字和标点

基本也就是你的键盘上有什么就是什么了

/即使这样,用ASCII也能搞艺术……

都是大触啊!

图片来源:larc.unt.edu/

所以呢,早期大家聊天的表情

笑脸都是“:)”这样的

上古网络小说《第一次的亲密接触》里面

宅男主角可是能够对着这样一个微笑符号yy好久的

但是ASCII的128个字符肯定是不够用的

别说表情了

你让人家打个naïve

都没法点上“很天真”的两个点

很难受是吧

欧洲的各国工程师更是不能忍

于是他们在ASCII的基础上

制定了 扩展版的ESCII

将原来的7位扩展为8位

空间一下子从128升级到了256

但是由于做扩展ASCII的人太多

标准并不兼容

这时候就已经有前面提到的表格符号了

此外还有不少数学符号、货币符号

——对表情包事业也是巨大的贡献啊!

/代码页437从128位到255位的字符编码

图片来源:utopia.knoware.nl/

其实不仅仅是这些符号

前面空出来的“控制符”区域

其实被一些系统

暗戳戳地规定成了 “特别图像字元”

里面藏了黑白两个笑脸呢!

这大概就是 “官方表情包” 了?

但……其实并非每个系统都采用了这些字符

并不能算是标准

/看到左上角的8比特笑脸了吗?图片来源:Wikipedia/

Anyway,随着信息事业扩展到世界各地

一个更大、更包容的编码系统势在必行

那就是 Unicode(万国码)

1991年正式发布的编码标准

从8位一下提升到了16位

一口气把前面说到那些奇奇怪怪的语言字符

都包含进来了

最关键的是

全部的简体和繁体中文也在这个系统里!

(中日韩的汉字是1992年加进来的)

至今为止,Unicode已经发布到了8.0版

一共120,737个字符

表情包的花样也跟着指数级上升

玩法被脑洞大开的世界各地网友不断翻新

比如前一阵子流行的所谓“Lenny face”:

这个和doge有点异曲同工的邪恶表情

“眉毛”和“嘴”其实是“双弱音符”(Double Breve)

和其它字符结合出现

并不是一个独立的字符

这种玩法也常见于

一个泰语的上标字符不断叠加成“搭楼”的效果

是一个意思

这些都是在Unicode编码系统内实现的

其它的什么太阳 ☀ 花草❀✿ 桃心 ❤ 萌萌大眼睛◕v◕之类

也都是Unicode编码系统里面的字符啦

总之,表情符号从很大程度上

是我们对于符号的重新赋意

虽然现在各个软件系统里面

都用图标定义了真正的“颜文字”

但我们依然热衷于用自己的脑补功力

在简单的线条和符号里制造生动的表情

你们还闲着干啥?

还不赶紧晒一下你最得意的表情……

打开APP阅读更多精彩内容