Nhóm ngôn ngữ Việt hay Nhóm ngôn ngữ Việt-Chứt là một nhánh của ngữ hệ Nam Á. Trước đây người ta còn gọi Nhóm ngôn ngữ này là Việt-Mường, Annam-Muong, Vietnamuong, nhưng hiện nay nói chung các tên gọi này được dùng để chỉ phân nhánh của Nhóm ngôn ngữ Việt Mường, trong đó chỉ bao gồm tiếng Việt và tiếng Mường.
Tiếng Việt ngày nay đã có ảnh hưởng đáng kể từ tiếng Trung Quốc, đặc biệt là về từ vựng và hệ thống thanh điệu[2]. Từ Hán-Việt chiếm khoảng 30-60% số vốn từ vựng tiếng Việt, không bao gồm từ mượn từ Trung Quốc.
Nơi phát tích của Nhóm ngôn ngữ Việt thường được cho là Bắc Bộ.[3][4][5] Tuy nhiên, vẫn còn nhiều luồng ý kiến trái chiều xoay quanh vấn đề này. Chamberlain James R., dựa trên cơ sở sự đa dạng ngôn ngữ, cho rằng Nhóm ngôn ngữ Việt có lẽ phát tích từ khu vực các tỉnh Bolikhamsai, Khammouane ở Lào và Nghệ An, Hà Tĩnh, Quảng Bình ở Việt Nam ngày nay.[6] Chiều sâu lịch đại của Nhóm ngôn ngữ Việt cũng đã phải ít nhất nằm trong khoảng 2.500-2.000 năm (theo Chamberlain 1998); 3.500 năm (theo Peiros 2004); hoặc tầm 3.000 năm (theo Mark 2020).[6][7] Dù vậy, khảo cổ học đã chứng minh rằng trước thời Đông Sơn, cư dân châu thổ sông Hồng chủ yếu là người Nam Á: dữ liệu di truyền từ khu mộ Mán Bạc thuộc văn hóa Phùng Nguyên (có niên đại 1.800 TCN) rất gần với người nói tiếng Nam Á hiện đại;[8][9] trái lại, "di truyền lai hợp" từ di chỉ Núi Nấp thuộc văn hóa Đông Sơn lại có mối liên hệ với "người Đài từ Trung Quốc, người nói tiếng Tai-Kadai từ Thái Lan, và người nói tiếng Nam Á từ Việt Nam, bao gồm cả người Việt";[10] do đó, "con đường di cư của Vietic nhiều khả năng là xuống phía nam từ đồng bằng sông Hồng, chứ không phải là lên bắc. Sự đa dạng ngôn ngữ ở phía nam sẽ cần những lời giải thích khác."[11]
Tiếng Việt được nhận dạng là một ngôn ngữ Nam Á vào giữa thế kỷ XIX với nhiều bằng chứng rất thuyết phục. Ngày nay, tiếng Việt là một ngôn ngữ đơn âm tiết giống như tiếng Quảng Đông hay tiếng Thái và đã mất nhiều đặc điểm âm vị-hình vị của ngôn ngữ Nam Á nguyên thủy. Xuyên suốt chiều dài lịch sử, tiếng Việt đã vay mượn rất nhiều từ vựng của tiếng Hán lẫn các loại tiếng Thái.[12] Chính vì sự tiếp xúc ngôn ngữ lâu dài này nên việc phân loại tiếng Việt gặp nhiều khó khăn. Tuy vậy, những đặc điểm này chỉ là bề ngoài, là kết quả của sự tiếp xúc ngôn ngữ. Hiện vẫn có những nhà nghiên cứu không đồng tình với ý kiến phân loại tiếng Việt vào cùng nhóm với tiếng Khmer; nhưng giới chuyên gia hiện nay hầu như coi cách phân loại Môn-Khmer là chính thống.
Chamberlain (1998) cho rằng khu vực đồng bằng sông Hồng ban đầu là địa bàn cư trú của người Tai; còn người nói tiếng Việt di cư lên từ vùng Bắc Trung Bộ vào giữa thế kỷ VII - thế kỷ IX Công nguyên, bởi lẽ vùng Bắc Trung Bộ là nơi có rất nhiều phương ngữ Việt bảo thủ về mặt ngữ âm. Vì vậy, nơi phát tích của người Việt (và Việt-Mường tổ tiên) là ở phía nam sông Hồng.[6]
Mặt khác, Ferlus (2009) cho thấy rằng các phát minh đặc trưng của văn hóa Đông Sơn như chày, chèo và chõ dùng để đồ xôi, tương ứng với các đổi mới từ vựng trong nhánh Bắc Vietic (Việt–Mường) và nhánh Trung Vietic (Cuối-Chăm). Các danh từ mới để chỉ các phát minh này phái sinh từ gốc động từ chứ không phải là từ mượn. Sự phân bố hiện nay của Bắc Vietic cũng tương ứng với khu vực văn hóa Đông Sơn. Do đó, Ferlus kết luận rằng người Bắc Vietic (Việt-Mường) là hậu duệ trực tiếp của người Đông Sơn, tức là những người đã cư trú ở phía nam đồng bằng sông Hồng và Bắc Trung Bộ từ thiên niên kỷ 1 TCN.[4]
Ngoài ra, John Phan (2013, 2016)[13][14] cho rằng một thứ tiếng gọi là "Hán ngữ trung cổ An Nam" (Annamese Middle Chinese) từng có mặt ở thung lũng sông Hồng và sau này bị hấp thụ vào tiếng Việt-Mường nguyên thủy.[15] Tiếng Hán trung cổ An Nam là một phần của dãy phương ngữtiếng Hán trung cổ vùng tây nam Trung Quốc, sau này "đa dạng hóa" thành tiếng Hán Ngõa Hương, tiếng patois Cửu Đô Thổ Thoại 九都土話 của Hạ Châu, Tiếng Bình phương nam, và các phương ngữ tiếng Tương của Trung Quốc (ví dụ: Tương Hương 湘鄉, Lô Khê 瀘溪, Kỳ Đông 祁東, và Tuyền Châu 全州).[14] Phan (2013) liệt kê ba loại từ Hán-Việt chính, được vay mượn ở các thời đại khác nhau:
Hán-Việt sớm (Nhà Hán (k. thế kỷ 1 CN) và Đông Tấn (k. thế kỷ 4 CN))
Liha, Phong (Chăm), và Toum: mường Khamkeuth; có lẽ gốc gác của họ ở vùng biên giới bắc Nghệ An/Khamkeut
Ahoe: gốc gác ở Na Tane trực thuộc mường Nakai, và thôn Ban Na Va trực thuộc mường Khamkeut; trong chiến tranh bị di dời sang mường Hinboun, và cuối cùng tái định cư tại Nakai Tay (39 hộ) và Sop Hia (20 hộ) trên Cao nguyên Nakai.
Thavưng (phương ngữ Ahao và Ahlao): rất nhiều thôn làng quanh Lak Xao; có lẽ gốc gác ở vùng Na Heuang
Chứt: Ban Na Phao và Tha Sang, mường Boualapha; số khác có lẽ cư trú tại Pha Song, Vang Nyao, Takaa; gốc gác từ Hin Namno và Việt Nam
Atel: huyện Tha Meuang bên sông Nam Sot (hầu hết là đồng bào người Malang); gốc gác từ vùng Houay Kanil
Atop: Na Thone, mường Khamkeut (hầu hết là đồng bào người Tai Theng); gốc gác từ vùng Thượng Sot
Mlengbrou: cạnh sông Nam One; sau này bị di dời sang mường Yommalath bên kia Núi Ak, và hiện thì sinh sống ở Ban Sang, mường Yommalath (hầu hết là đồng bào người Yooy)
Ở Việt Nam, một số tộc người miền núi nói tiếng Vietic (bao gồm Arem, Rục, Maliêng và Mày) được tái định cư ở Cu Nhái (phía tây tỉnh Quảng Bình hoặc phía tây nam của huyện Hương Khê, tỉnh Hà Tĩnh). Dân tộc Sách có cư trú trên đất Việt Nam.
Bảng sau đây liệt kê lối sống của các nhóm dân tộc Vietic. Không giống như các nhóm dân tộc Tai lân cận, nhiều nhóm Vietic không có thuật canh tác lúa nước:
Loại hình văn hóa của các nhóm sắc tộc nói tiếng Vietic[6]
Việc phát hiện ra tiếng Việt là một ngôn ngữ thuộc nhóm ngôn ngữ Môn-Khmer, thanh điệu của nó là sự phản tỉnh bình thường các đặc điểm phi thanh điệu trong các ngôn ngữ còn lại của ngữ hệ được coi là một cột mốc quan trọng trong sự phát triển của ngôn ngữ học lịch sử. Nhóm ngôn ngữ Việt cho thấy một phạm vi loại hình từ loại hình tiếng Trung hoặc tiếng Thái, đến loại hình ngôn ngữ Môn-Khmer điển hình, bao gồm hệ thống thanh điệu và tạo âm phức tạp hay từ trộn; kiểu âm tiết CVC hoặc CCVC; đơn âm tiết, đa âm tiết và kiểu hình đơn lập hay kết hợp.
Tiếng Arem: Ngôn ngữ này thiếu âm tính hà hơi có mặt trong hầu hết các ngôn ngữ Việt, nhưng lại có phụ âm cuối thanh hầu hoá.
Tiếng Aheu (Thavưng): Ngôn ngữ này phân biệt giữa âm thường và âm hà hơi kết hợp với phụ âm cuối thanh hầu hoá. Điều này rất giống với trường hợp của các ngôn ngữ Pear, tuy nhiên, sự thanh hầu hoá này nằm ở nguyên âm.
Tiếng Rục, Sách, Mày và Chứt: Một cụm phương ngữ; hệ thống thanh điệu bốn âm vực với tiếng Aheu phân biệt theo cao độ.
Tiếng Maleng (Bo, Pakatan): Thanh điệu giống với tiếng Rục, Sách.
Tiếng Tày Poọng, Tày Hung, Tày Tum, Khong-Kheng.
Việt - Mường: Tiếng Việt và Tiếng Mường. Hai ngôn ngữ này chia sẻ 75% số từ vựng cơ bản và có cùng hệ thống âm vực 5 - 6 mức độ. Đây là những đặc điểm tiêu chuẩn của các ngôn ngữ Việt khác: Ba thanh thấp và ba thanh cao tương ứng với các phụ âm đầu vô thanh và hữu thanh trong ngôn ngữ tổ tiên; những cái này sau đó phân tách tùy thuộc vào phụ âm cuối nguyên gốc: cấp thanh điệu tương ứng với âm tiết mở hoặc phụ âm mũi cuối cùng; thanh tăng cao và giảm thấp tương ứng với các âm tắc cuối cùng, đã biến mất; thanh điệu đến âm xát cuối cùng, cũng đã biến mất; và các thanh thanh hầu hoá đến các phụ âm thanh hầu hoá cuối, mà đã phản thanh hầu hoá.
Nhóm Thavưng–Malieng vẫn giữ nhiều đặc điểm âm vị và từ vựng rất cổ xưa, còn nhóm Chứt dung hòa hai âm cuối *-r và *-l thành *-l cùng với các ngôn ngữ phía bắc.[16]
Chamberlain (2018:9)[19] sử dụng thuật ngữ Kri-Mol để chỉ nhánh Vietic, và cho rằng có hai nhánh tách rời lớn, đó là Mol-Toum và Nrong-Theun. Chamberlain (2018:12) đưa ra cây phân loại sau đây.
Dựa trên các nghiên cứu so sánh của Ferlus (1982, 1992, 1997, 2001) và các nghiên cứu tiếng Mường mới đây của Phan (2012),[20] Sidwell (2015)[21] chỉ ra rằng tiếng Mường là nhóm cận ngành và là phân nhóm của nhóm Việt. Sidwell (2015) đề xuất cây phân loại nội nhóm Vietic như sau.
Vietic
Việt-Mường: Việt, Mường Muốt, Mường Nà bái, Mường Chỏi, vv.
Cây phân loại sau dựa theo Chamberlain (2003:422), trích từ Sidwell (2009:145). Không giống các phân loại cũ, có một nhánh "Nam" thứ sáu bao gồm tiếng Kri, một ngôn ngữ mới được mô tả lúc bấy giờ.
Thanh điệu trong tiếng Việt bắt nguồn từ các âm vị ở cuối từ trong ngôn ngữ tổ tiên chung của Nhóm ngôn ngữ Việt. Thanh sắc và nặng của tiếng Việt xuất hiện ở những từ có âm tắc /*-p *-t *-c *-k *-ʔ/ cuối từ, thanh hỏi và ngã bắt nguồn từ âm /*-h/ và /*-s/, còn thanh ngang và huyền từ các trường hợp còn lại.
Các cụm phụ âm đầu *k-l, *b-l và *p-l được lưu giữ ở nhiều ngôn ngữ. *k-l trở thành /ʈʂ~ʈ/ (viết là ‹tr›) trong tiếng Việt. *b-l và *p-l cũng trở thành ‹tr› trong mọi phương ngữ Trung và Nam Bộ, nhưng lại thường trở thành /z/ (viết là ‹gi›) trong các phương ngữ Bắc Bộ (so sánh giời và trời, gio và tro, giầu và trầu, giai và trai). *k-l, *b-l và *p-l phát triển thành /tl/ trong tiếng Mường (nhưng có phương ngữ mà cả ba đều giữ nguyên, hay *b-l và *p-l hợp nhất).
Hai âm bật hơi *pʰ và *kʰ được xát hóa thành lần lượt /f/ ‹ph› và /x/ ‹kh› ở những phương ngữ Bắc Bộ, nhưng được lưu giữ phần nào trong các phương ngữ Trung Bộ, một số phương ngữ Nam Bộ và trong các ngôn ngữ khác.
Michel Ferlus (1992, 2013)[23][24] phát hiện rằng tên của 12 con giáp trong lịch Khmer (cũng chính là nguồn gốc của 12 con giáp trong lịch Thái) được vay mượn từ một dạng Việt-Mường bảo thủ về mặt ngữ âm. Ferlus cho rằng 12 con giáp Khmer có nguồn gốc từ một ngôn ngữ Việt-Mường nào đó (tức nhánh Bắc Vietic), chứ không phải từ một ngôn ngữ Nam Vietic, vì nguyên âm của từ "rắn" m.saɲ trong tiêng Khmer cổ tương ứng với âm /a/ của Việt-Mường chứ không phải âm /i/ của Nam Vietic.
^"Dê" tiếng Việt và "tê" tiếng Mường bắt nguồn từ gốc *-teː của tiếng Vietic nguyên thủy, không chung gốc với những từ liệt kê ở đây
^Phương ngữ Nghệ-Tĩnh; âm /*ɔː/ hạt nhân thường sẽ trở thành nguyên âm đôi /uə/ (chính tả là -uô-) trong các phương ngữ khác, vd: tiếng Huếruộng /ʐuəŋ˨˩ʔ/ so với tiếng Nghệ-Tĩnh roọng /ʐɔːŋ˨˨/, đều bắt nguồn từ *rɔːŋʔ "ruộng" của tiếng Vietic nguyên thủy
^Từ cổ; hiện hóa thạch lại trong từ cá cúi, tức "cá lợn"
^Nordhoff, Sebastian; Hammarström, Harald; Forkel, Robert; Haspelmath, Martin biên tập (2013). “Vietic”. Glottolog. Leipzig: Max Planck Institute for Evolutionary Anthropology.
^Linguistic Research on the Origins of the Vietnamese Language: An Overview, Journal of Vietnamese Studies 1(1-2):104-130, 2006
^Sagart, Laurent (2008), “The expansion of Setaria farmers in East Asia”, Past human migrations in East Asia: matching archaeology, linguistics and genetics, tr. 141–145, The cradle of the Vietic branch of Austroasiatic is very likely in north Vietnam, at least 1000km to the south‑west of coastal Fújiàn
^ abcdeChamberlain, J.R. 1998, "Nguồn gốc tộc Sek: ngụ ý về lịch sử Thái và Việt", trong The International Conference on Tai Studies, S. Burusphat (chủ biên), Bangkok, Thái Lan, tr. 97-128. Viện Ngôn ngữ và Văn hóa vì sự phát triển vùng nông thôn, Đại học Mahidol.
^Lipson, Mark; Cheronet, Olivia; Mallick, Swapan; Rohland, Nadin; Oxenham, Marc; Pietrusewsky, Michael; Pryce, Thomas Oliver; Willis, Anna; Matsumura, Hirofumi; Buckley, Hallie; Domett, Kate; Hai, Nguyen Giang; Hiep, Trinh Hoang; Kyaw, Aung Aung; Win, Tin Tin; Pradier, Baptiste; Broomandkhoshbacht, Nasreen; Candilio, Francesca; Changmai, Piya; Fernandes, Daniel; Ferry, Matthew; Gamarra, Beatriz; Harney, Eadaoin; Kampuansai, Jatupol; Kutanan, Wibhu; Michel, Megan; Novak, Mario; Oppenheimer, Jonas; Sirak, Kendra; Stewardson, Kristin; Zhang, Zhao; Flegontov, Pavel; Pinhasi, Ron; Reich, David (17 tháng 5 năm 2018). “Ancient genomes document multiple waves of migration in Southeast Asian prehistory”. Science. Hiệp hội vì Sự tiến bộ Khoa học Mỹ (AAAS). 361 (6397): 92–95. Bibcode:2018Sci...361...92L. bioRxiv10.1101/278374. doi:10.1126/science.aat3188. ISSN0036-8075. PMC6476732. PMID29773666.
^Corny, Julien, et al. 2017. "Dental phenotypic shape variation supports a multiple dispersal model for anatomically modern humans in Southeast Asia." Journalof Human Evolution 112 (2017):41-56. được trích dẫn trong Alves, Mark (2019-05-10). "Data from Multiple Disciplines Connecting Vietic with the Dong Son Culture". Hội đàm: "Contact Zones and Colonialism in Southeast Asia and China's South (~221 BCE - 1700 CE)"Tại: Đại học Bang Pennsylvania
^LaPolla, Randy J. (2010). "Language Contact and Language Change in the History of the Sinitic Languages." Procedia - Social and Behavioral Sciences, 2(5), 6858-6868.
^ abPhan, John D. & de Sousa, Hilário. 2016. A preliminary investigation into Proto-Southwestern Middle Chinese. (Tờ báo được trình bày tại International workshop on the history of Colloquial Chinese – written and spoken, Đại học Rutgers, New Brunswick NJ, 11–12 tháng Ba 2016.)
^Phan, John. "Re-Imagining 'Annam': A New Analysis of Sino–Viet–Muong Linguistic Contact" trong Chinese Southern Diaspora Studies, Volume 4, 2010. tr. 22-3
^ abSidwell, Paul (2021). “Classification of MSEA Austroasiatic languages”. The Languages and Linguistics of Mainland Southeast Asia. De Gruyter. tr. 179–206. doi:10.1515/9783110558142-011. ISBN9783110558142.
^Sidwell, Paul và Mark Alves. Đang chuẩn bị. A Phylogenetic Analysis of Vietic.
^Alves, Mark J. (2021). “Typological profile of Vietic”. The Languages and Linguistics of Mainland Southeast Asia. De Gruyter. tr. 469–498. doi:10.1515/9783110558142-022. ISBN9783110558142.
^ abPhan, John D. 2012. "Mường is not a subgroup: Phonological evidence for a paraphyletic taxon in the Viet-Muong sub-family." Mon-Khmer Studies 40:1-18.
^Sidwell, Paul. 2015. "Austroasiatic classification." In Jenny, Mathias và Paul Sidwell, đồng chủ biên (2015). The Handbook of Austroasiatic Languages, 144-220. Leiden: Brill.
Alves, Mark J. 2016. Identifying Early Sino-Vietnamese Vocabulary via Linguistic, Historical, Archaeological, and Ethnological Data, trong Bulletin of Chinese Linguistics 9 (2016):264-295.
Alves, Mark J. 2017. Etymological research on Vietnamese with databases and other resources. Ngôn Ngữ Học Việt Nam, 30 Năm Đổi Mới và Phát Triển (Kỷ Yếu Hội Thảo Khoa Học Quốc Tế), 183-211. Hà Nội: Nhà xuất bản Khoa học Xã hội.
Barker, M. E. (1977). Articles on Proto-Viet–Muong. Vietnam publications microfiche series, no. VP70-62. Huntington Beach, Calif: Học viện Ngôn ngữ học mùa hè.
Chamberlain, J.R. 2003. Eco-Spatial History: a nomad myth from the Annamites and its relevance for biodiversity conservation. Trong X. Jianchu và S. Mikesell, biên tập. Landscapes of Diversity: Proceedings of the III MMSEA Conference, 25–28 tháng Tám, 2002. Lijiand, Cộng hòa Nhân dân Trung Hoa: Center for Biodiversity and Indigenous Knowledge [Trung tâm Đa dạng sinh học và Kiến thức bản địa]. tr. 421–436.
Nguyễn, Tài Cẩn. (1995). Giáo trình lịch sử ngữ âm tiếng Việt (sơ thảo). Hà Nội: Nhà xuất bản Giáo dục.
Pain, Frederick (2020). “"Giao Chỉ" (Jiaozhi 交趾) as a Diffusion Center of Middle Chinese Diachronic Changes: Syllabic Weight Contrast and Phonologisation of Its Phonetic Correlates”. Tsing Hua Journal of Chinese Studies. 50 (3): 356–437. doi:10.6503/THJCS.202009_50(3).0001.
Peiros, Ilia J. 2004. Geneticeskaja klassifikacija aystroaziatskix jazykov. Moskva: Rossijskij gosudarstvennyj gumanitarnyj universitet (doktorskaja dissertacija).
Trần Trí Dõi (2011). Một vài vấn đề nghiên cứu so sánh - lịch sử nhóm ngôn ngữ Việt - Mường. Hà Nội: Nhà xuất bản Đại học Quốc gia Hà Nội. ISBN978-604-62-0471-8
Sidwell, Paul (2009). Classifying the Austroasiatic languages: history and state of the art. LINCOM studies in Asian linguistics, 76. Munich: Lincom Europa.