人造语言吧 关注:8,630贴子:204,072

【科普向】关于gloss的一些介绍

只看楼主收藏回复

这里来介绍一下很多语法书里会参考的一种gloss的规则。本帖全贴参考《The Leipzig Glossing Rules》,主要会是一些翻译和少量讲解。


IP属地:上海来自Android客户端1楼2021-08-07 21:26回复
    「The Leipzig Glossing Rules」是由「the Department of Linguistics of the Max Planck Institute for Evolutionary Anthropology (Bernard Comrie, Martin Haspelmath)」和「the Department of Linguistics of the University of Leipzig (Balthasar Bickel).」共同制定和完善的。这个规则中有对于行间注释的「句法」和「语义」(用法和意义)的十条规则,以及附上的分类标记缩写词表。尽管这些规则涵盖了语言学家(同样适用于造语者)在注释中使用的需要,大多数作者还是会需要对某些规则做一定的添加或调整(尤其是分类标记)。不过设定一个语言学家(造语者)可以参考的标准规则确实是实用的,本规则就被语言学家社区认为如此。本规则的目的是反映通常的用法,不建议太多的(通常是可选的)创新。


    IP属地:上海来自Android客户端2楼2021-08-07 21:31
    回复
      前言我概括地说一下。gloss是为了语素对语素地展示句子中成分的意思和语法意义,并且在不同情况下会有不同的侧重点。同一语料在不同作者手中也可能会由于理解、分析、风格等出现不同的gloss。本文的目的是展示那些最常用的gloss规则。这些规则也通常是在不同方面上具有弹性的,也会有一些可选项的出现。本文假定面向的是论文或语法书,只有语素的分析,在完整的语料中也会出现本规则中不包含的,例如词组等。gloss很少会是完整的形态学描述,而应提供一些对于文本结构的相关信息。另外,附上的分类标记缩写表并不是作为分类的依据,而只是提供标准的缩写方式。



      IP属地:上海来自Android客户端3楼2021-08-07 22:25
      回复
        ♡规则一~♡
        行间注释一般是词对词地垂直左对齐,如例。


        IP属地:上海来自Android客户端4楼2021-08-07 22:56
        回复
          学习一个


          IP属地:德国来自Android客户端5楼2021-08-07 23:00
          收起回复
            ♡规则二〜♡
            可分的语素在语例和gloss中被连字符分隔。在语例和gloss里出现的连字符数量必须是相同的。
            (例二见图)
            由于连字符的分隔和左对齐的缘故,文本会看起来有些奇怪,有些作者会在开头加一行,把未经调整的原文放在这一行里,也可能会使用规则4(尤其是规则4C)。
            附着语素在语料和gloss中都用等号标记。
            (例三见图)
            出现在两个语素中间的附着成分可以被分配到它前面的语素或它后面的语素。至于要选择哪个语素则是由一些不易概括的规则来决定,这里就不给出相关的规则了。
            ♡规则二 · A〜♡
            如果一个在语素的边界出现的(具有语法意义的)元素被认为是单独的(??)的词汇,可以在语料中使用一个空格后再加一个连字符,但在gloss中仍然直接使用连字符
            (例四见图)



            IP属地:上海来自Android客户端6楼2021-08-07 23:58
            回复
              ♡规则三〜♡
              语法性的语素基本上由缩写的「语法范畴的名称」来表现,这些标记一般由小号大写字母来排印。本文后附有一份标准的缩写词表。
              一些由标准缩写而来的改动在特定场合下也是有必要的,例如一个语法范畴在某个语言中出现频率很高,那么一个更简单的缩写就会更加便利,例如CPL代替COMPL作为completive的缩写,PF代替PRF作为perfect的缩写等等。同理,如果一个范畴出现频率很低,那么简单地不缩写也是可以的。
              在很多情况下,用范畴的名称,亦或是元语言(注:被用来描述语料的语言)中的词汇都是可以的。因此,像例五中的两种gloss可以根据gloss的不同目的来进行选择。


              IP属地:上海来自Android客户端7楼2021-08-08 00:14
              回复
                仔细读读发现自己的语法书里虽然用了但也没有严格地遵守...学到了 .jpg


                IP属地:上海来自Android客户端8楼2021-08-08 00:17
                回复
                  ♡规则4〜♡
                  当一个目标语言的单个成分需要多个元语言成分来描述时,这几个元语言成分就需要用「.」来分隔。
                  (例六到十一见图)
                  所对应元语言的成分的排序涉及一些复杂的规则,这里不多赘述。
                  目标语言和gloss成分之间的一对多对应是有各种原因的。这些(原因)都被句号的统一使用合并(模糊化?)了。如果想把它们区分开来,可以参考规则四A到E。



                  IP属地:上海来自Android客户端9楼2021-08-08 14:33
                  回复
                    ♡规则4A♡(可选)
                    如果一个目标语言的成分无论在形式还是语义上都不能被分隔成多个元素,而元语言恰好也没有对应的单个的词,下划线可以用来代替句号。
                    (例十二见图)
                    ♡规则4B♡(可选)
                    如果一个目标语言的元素在形式上是不可分隔的,但是同时有着多个可以明确区分的(语法)意义,那么分号就可以使用
                    (例十三、十四见图)
                    ♡规则四C♡(可选)
                    如果一个目标语言的成分是在形式上和语义上都是可分的,但是由于它是无关紧要的,或想要保持文本完整性而不展示出规范的分隔,那么可以使用冒号。
                    (例十五见图)
                    ♡规则四D♡(可选)
                    如果一个目标语言中的语法意义是由形态音韵上来变化的,例如元音交替、(词根上的?)变形、声调转变等,这种情况下就可以使用「\」来分隔这个范畴的名称和其他gloss。
                    (例十六到十八见图)
                    ♡规则四E♡(可选)
                    如果一门语言中含有同时表示施事者和受事者的人称与数的词缀,那么可以使用「>」。大于号左边是施事者,右边则是受事者。
                    (例十九见图)



                    IP属地:上海来自Android客户端10楼2021-08-08 15:08
                    回复
                      ♡规则五♡
                      人称和数在以「人称+数」的顺序排列的时候不用句号隔开。
                      (例二十见图)
                      ♡规则五A♡(可选)
                      数-性标记在有些语言中出现得非常频繁,尤其是在与人称结合时。因此,有些作者会用不使用句号隔开的小写缩写。如果选择了这样的方式,那么可以参考例二十一中的gloss。
                      (例二十一见图)


                      IP属地:上海来自Android客户端11楼2021-08-08 17:34
                      回复
                        ♡规则六♡
                        如果在语素对语素的gloss中出现了在语料中没有对应的显性成分的范畴,那么这些范畴可以用大括号来表示。当然,另一种在语料文本中使用「Ø」来表示非显性的方法也是可行的。这里的Ø和通常的显性成分一样需要用连字符隔开。
                        (例二十二见图)
                        ♡规则七♡
                        一些固有的,非显性的范畴,例如名词的性,也可以在gloss中表明,不过需要使用圆括号标明。
                        (例二十三见图)


                        IP属地:上海来自Android客户端12楼2021-08-08 17:34
                        回复
                          ♡规则八♡
                          有两个部分构成的语法性或是词汇性的成分可以被看作两个单独的部分。例如,像Lakhota语中「na-xʔu̹(听)」这样的由两部分构成的词干可能会如下处理:
                          1. 单纯地重复gloss:
                          (例二十四见图)
                          2. 两个部分之一可以用特殊标记标志,例如「STEM」:
                          (例二十五见图)
                          所谓环缀可看作由两部分构成的词缀,因此也可以以相同的方式来处理,例:
                          (例二十六见图)



                          IP属地:上海来自Android客户端13楼2021-08-08 17:35
                          回复
                            ♡规则九♡
                            中缀和其在gloss中对应的部分都需要被包围在尖括号中。
                            (例二十七、二十八见图)
                            中缀在词根的偏左方还是偏右方通常是容易辨认的,这也决定了gloss中中缀放在对应的词干的左侧还是右侧。如果中缀的左右位置不明确,那么其他排布gloss的方法也是有必要的。


                            IP属地:上海来自Android客户端14楼2021-08-08 17:36
                            回复
                              ♡规则十♡
                              重叠和词缀的处理是相似的,但是使用一个波浪线以代替连字符连接词干和重叠部分。
                              (例二十九至三十一见图)



                              IP属地:上海来自Android客户端15楼2021-08-08 17:36
                              回复