Ngữ hệ Ấn-Âu là một ngữ hệ lớn có nguồn gốc từ Tây và Nam đại lục Á-Âu. Nó bao gồm hầu hết ngôn ngữ của châu Âu cùng với các ngôn ngữ ở sơn nguyên Iran và miền bắc tiểu lục địa Ấn Độ. Một số ngôn ngữ Ấn-Âu, chẳng hạn như tiếng Anh, tiếng Pháp, tiếng Bồ Đào Nha và tiếng Tây Ban Nha đã lan rộng nhờ làn sóng thuộc địa hóa của người châu Âu và hiện được sử dụng trên khắp thế giới. Hệ Ấn-Âu được chia thành nhiều nhánh, lớn nhất phải kể đến đó là các nhóm Ấn-Iran, German, Rôman và Balt-Slav. Các ngôn ngữ có số người nói lớn nhất là tiếng Tây Ban Nha, tiếng Anh, tiếng Hindustan (tiếng Hindi/Urdu), tiếng Bồ Đào Nha, tiếng Bengal, tiếng Marathi, tiếng Punjab và tiếng Nga (mỗi thứ tiếng có hơn 100 triệu người nói). Tiếng Đức, Pháp, Ý và Ba Tư đều có hơn 50 triệu người nói. Tổng cộng, 46% dân số thế giới (3,2 tỷ người) có tiếng mẹ đẻ là ngôn ngữ Ấn-Âu, đông đảo nhất so với bất kỳ ngữ hệ nào khác. Theo ước tính của Ethnologue, có khoảng 445 ngôn ngữ Ấn-Âu đang được sử dụng, hơn 2/3 (313) trong số đó thuộc nhánh Ấn-Iran.[2]
Tất cả các ngôn ngữ Ấn-Âu đều bắt nguồn từ một ngôn ngữ mẹ duy nhất, gọi là tiếng Ấn-Âu nguyên thủy, từng được nói ở một thời điểm nào đó thuộc thời đại đồ đá mới. Urheimat (hay còn dịch là quê nhà ngôn ngữ, tức là nơi ngữ hệ đó phát tích) chính xác của tiếng Ấn-Âu hiện vẫn đang là chủ đề của nhiều học thuyết cạnh tranh. Trong số đó thì thuyết Kurgan đang rất được đề cao, cho rằng nơi phát tích hệ Ấn-Âu tọa lạc tại vùng thảo nguyên Pontus–Caspi và gắn liền với văn hóa Yamna có niên đại khoảng 3.000 năm TCN. Trước thời điểm phát minh ra chữ viết, hệ Ấn-Âu đã lan rộng và phân tách thành các nhánh, phân bố khắp châu Âu, Tây và Nam Á. Văn liệu độc lập của ngôn ngữ Ấn-Âu manh nha xuất hiện vào thời kỳ đồ đồng dưới dạng tiếng Hy Lạp Mycenaea và các ngôn ngữ Tiểu Á như tiếng Hitti và tiếng Luwia. Tuy vậy, manh mối Ấn-Âu lâu đời nhất được phát hiện lại là một số từ và tên riêng tiếng Hitti được ghi xen kẽ trong các văn bản tiếng Akkad cổ đại tại di chỉ Kültepe của dân tộc Assyria miền đông Tiểu Á vào thế kỷ 20 TCN.[3] Mặc dù người Ấn-Âu cổ hơn không để lại bất kỳ văn liệu nào, ta vẫn có thể biết được một số khía cạnh đời sống văn minh của họ, nhờ vào sự so sánh các văn hóa hậu duệ và phục nguyên văn hóa nguyên thủy đó.[4]
Hệ Ấn-Âu có ý nghĩa rất quan trọng đối với lĩnh vực ngôn ngữ học lịch sử vì nó sở hữu lịch sử được ghi chép cổ thứ hai so với bất kỳ hệ nào được biết đến, chỉ đứng sau ngữ hệ Phi-Á với tiếng Ai Cập và các ngôn ngữ Semit còn cổ hơn rất nhiều. Phân tích mối liên hệ giữa các ngôn ngữ Ấn-Âu và phục dựng lại căn nguyên của chúng là trọng tâm cho sự phát triển phương pháp luận ngành ngôn ngữ học lịch sử, đưa lĩnh vực này thành một ngành khoa học hàn lâm thật sự vào thế kỷ XIX.
Hệ Ấn-Âu hiện không có liên hệ với bất kỳ ngữ hệ nào khác, mặc dù một số đề xuất gây tranh cãi vẫn đã được đưa ra.
Vào thế kỷ XVI, những người châu Âu đi đến tiểu lục địa Ấn Độ bắt đầu nhận ra những nét tương tự giữa các ngôn ngữ Ấn-Arya, Iran, và châu Âu. Năm 1583, nhà truyền giáo Dòng Tên người Anh Thomas Stephens tại Goa đã viết một lá thư cho người thân (không được công bố cho tới tận thế kỷ XX),[5] mà trong đó ông đề cập đến sự tương đồng giữa ngôn ngữ Ấn Độ (đặc biệt là tiếng Phạn) với tiếng Hy Lạp và tiếng Latinh.
Filippo Sassetti, một nhà buôn sinh ra tại Florence năm 1540, cũng nhận thấy điều tương tự khi đi đến Ấn Độ. Năm 1585, ông ghi nhận một số sự tương đồng từ vựng giữa tiếng Phạn và tiếng Ý (gồm devaḥ/dio "chúa", sarpaḥ/serpe "rắn", sapta/sette "bảy", aṣṭa/otto "tám", và nava/nove "chín").[5] Tuy nhiên, quan sát của Stephens và Sassetti đã không dẫn đến nghiên cứu chuyên sâu hơn nào.[5]
Thomas Young lần đầu tiên sử dụng thuật ngữ Indo-European năm 1813, dựa trên phân bố địa lý của hệ này: từ Tây Âu tới Bắc Ấn Độ.[6][7] Từ đồng nghĩa Indo-Germanic (Ấn-German, Idg. hay IdG.), xuất hiện năm 1810 bằng tiếng Pháp (indo-germanique) trong nghiên cứu của Conrad Malte-Brun; thuật ngữ này hiện bị xem là lỗi thời và ít phổ biến hơn Indo-European, dù trong tiếng Đức indogermanisch vẫn là thuật ngữ chuẩn.
Ngữ hệ Ấn-Âu được chia thành 10 nhánh chính, được liệt kê dưới đây theo thứ tự bảng chữ cái:
Nhánh Albania được chứng thực từ thế kỷ XIII;[9] phát triển từ tiếng proto-Albania phái sinh từ một ngôn ngữ Balkan cổ nào đó, có giả thuyết cho rằng là tiếng Illyria;[10] tuy nhiên, bằng chứng cho giả thuyết này không đủ để đi đến kết luận.[11]
Nhánh Anatolia từng được nói ở vùng Tiểu Á và tuyệt chủng vào hậu kỳ cổ điển, được chứng thực bằng một số từ tiếng Luwia/Hitti xen kẽ trong các văn bản viết bằng tiếng Assyria cổ từ thế kỷ thứ 20 và 19 TCN, gần đây hơn là các bản khắc Hitti có niên đại khoảng 1650 TCN.[12][13]
Nhánh Balt-Slav, được hầu hết các học giả nghiên cứu Ấn-Âu[14] tạo thành cùng một đơn vị nhánh duy nhất, trong khi một số ít các nhà ngôn học cho rằng điểm tương đồng giữa các ngôn ngữ này chỉ là do sự tiếp xúc và vay mượn.
Phân nhánh Balt được chứng thực từ thế kỷ XIV; các ngôn ngữ của nhánh này vẫn giữ nhiều đặc điểm rất cổ xưa của tiếng Ấn-Âu nguyên thủy (PIE) nếu so sánh với các nhánh khác. Các ngôn ngữ Balt hiện bao gồm tiếng Lithuania và tiếng Latvia.
Nhánh Tochari, có lẽ liên hệ với văn hóa Afanasevo ở Nam Siberi.[18] Hai ngôn ngữ của nhánh này từng tồn tại đó là tiếng Turfani và Kuche (hoặc tiếng Tochari A và B), được chứng thực từ khoảng thế kỷ thứ 6 đến thế kỷ thứ 9. Các ngôn ngữ này bị mai một dưới sự cai trị của Vương quốc Hồi Cốt và có lẽ đã tuyệt chủng hoàn toàn vào thế kỷ 10 CN.
Ngoài mười nhánh cổ điển được liệt kê ở trên, một số ngôn ngữ và nhóm ngôn ngữ Ấn-Âu đã tuyệt chủng, ít được biết đến hơn đã tồn tại hoặc được đề xuất là đã tồn tại:
Tiếng Bỉ Cổ: ngôn ngữ giả định liên kết với vùng văn hóa Nordwestblock được đề xuất. có giả thuyết cho rằng nó có quan hệ với nhánh Italic (Gốc Ý) hoặc nhánh Venetic, và có các đặc điểm âm vị gần giống với tiếng Lusitania.
Tiếng Cimmeria: có lẽ là một ngôn ngữ thuộc nhánh Iran, hoặc Thrace, hoặc Celt
Tiếng Dacia: có lẽ có quan hệ rất gần với tiếng Thrace
Tiếng Elymia: Ngôn ngữ được nói bởi người Elymia, một trong số ba tộc người bản địa (tức là tiền-Hy Lạp và tiền-Punic) của đảo Sicily. Chưa chắc là nó thuộc hệ Ấn-Âu, nhưng có giả thuyết liên hệ nó với nhánh Italic hoặc Anatolia (Tiểu Á).
Ngữ tộc Illyria: có lẽ có quan hệ với tiếng Albania, Messapia, hoặc cả hai
Tiếng Liburnia: xếp loại đang bị nghi ngờ, nhiều đặc điểm chung với Venetic, Illyria, và Ấn-Hitti, thể hiện các đặc điểm chuyển biến lớn từ Tiền-Ấn-Âu
Tiếng Sicel: ngôn ngữ của người Sicel cổ (Tiếng Hy Lạp: Sikeloi, tiếng La-tinh: Siculi), một trong số ba tộc người bản địa (tức là tiền-Hy Lạp và tiền-Punic) của đảo Sicily. Được đề xuất là có liên hệ với La-tinh hoặc proto-Illyria (Tiền-Ấn-Âu) ở giai đoạn sớm hơn.[20]
Tiếng Sorothapt: một ngôn ngữ Iberia được đề xuất, tiền-Celt
Tiếng Venetic: chia sẻ nhiều điểm tương đồng với tiếng La-tinh và các ngôn ngữ gốc Ý, ngoài ra còn có thêm các đặc điểm giống với German và Celt.[21][22]
Việc phân chia các ngôn ngữ Ấn-Âu thành các nhóm satem và centum được nhà ngôn ngữ học Peter von Bradke đưa ra vào năm 1890, mặc dù Karl Brugmann đã đề xuất một kiểu phân loại tương tự vào năm 1886. Ở các ngôn ngữ satem, bao gồm nhánh Balto-Slav và Ấn-Iran, cũng như (về hầu hết các khía cạnh) Albania và Armenia, các âm ngạc mềm bị ngạc cứng hóa của Proto-Ấn-Âu được phục dựng vẫn khác biệt và thường bị xát hóa, trong khi các âm ngạc mềm-môi hòa lẫn với 'các âm ngạc mềm thường'. Ở các ngôn ngữ centum, các âm ngạc mềm bị ngạc cứng hóa này hòa lẫn với các ngạc mềm thường, trong khi các âm ngạc mềm-môi vẫn khác biệt. Ví dụ như từ "một trăm" trong tiếng Avesta (satem) và tiếng Latinh (centum) — âm ngạc mềm bị ngạc cứng hóa ban đầu đã biến thành âm [s] xát ở Avesta, nhưng thành âm ngạc mềm [k] thường ở Latinh.
Đặc điểm này không phải là sự phân tách theo phả hệ, sự phân chia centum–satem thường được coi là kết quả của những thay đổi lan rộng trên các nhánh phương ngữ PIE trên một khu vực địa lý cụ thể; đường đồng ngữ centum–satem giao với một số đường đồng ngữ khác đánh dấu sự khác biệt giữa các đối tượng địa lý trong các nhánh IE sớm. Có thể là các nhánh centum trên thực tế phản ánh tình trạng ban đầu của tiếng PIE, và chỉ các nhánh satem chia sẻ một loạt các đổi mới, ảnh hưởng đến tất cả các khu vực ngoại vi của liên tục phương ngữ PIE.[23] Kortlandt đề xuất rằng tổ tiên của tiếng Balt và Slav đã bị satem hóa trước khi bị ảnh hưởng bởi tây Ấn-Âu.[24]
Tiếng Proto-Ấn-Âu (PIE) được đề xuất là tổ tiên chung được tái tạo của các ngôn ngữ Ấn-Âu, được nói bởi người Proto-Ấn-Âu (sắc tộc ngôn ngữ). Từ những năm 1960, kiến thức về tiếng Anatolia đã đủ chắc chắn để thiết lập mối quan hệ của nó với PIE. Sử dụng phương pháp nội phục dựng, một giai đoạn trước đó, gọi là Tiền Proto-Ấn-Âu, đã được đề xuất.
PIE là một ngôn ngữ biến tố, trong đó các mối quan hệ ngữ pháp giữa các từ được báo hiệu thông qua các hình vịbiến tố (thường ở cuối một từ). Từ gốc của PIE là những hình vị cơ bản mang một ý nghĩa từ vựng. Các hậu tố được thêm vào để tạo thành các thân từ, và bằng cách thêm vào các phần cuối, chúng lại tạo thành các từ biến tố (danh từ hoặc động từ). Hệ thống động từ Ấn-Âu được phục dựng rất phức tạp và giống như danh từ, thể hiện tính biến âm sắc.
Về mặt lịch sử, sự đa dạng hóa ngôn ngữ mẹ thành các nhánh ngôn ngữ con chưa được chứng thực. Tuy vậy, dòng thời gian của sự tiến hóa của các ngôn ngữ con hầu như không còn gì để bàn cãi, bất kể câu hỏi về nguồn gốc Ấn-Âu.
Sử dụng phương pháp phân tích toán học vay mượn từ sinh học tiến hóa, Don Ringe và Tandy Warnow đề xuất cây tiến hóa của các nhánh Ấn-Âu sau đây:[25]
Tiền-Anatolia (trước 3500 TCN)
Tiền-Tocharia
Tiền-Italia và Tiền-Celt (trước 2500 TCN)
Tiền-Armenia và Tiền-Hy Lạp (sau 2500 TCN)
Proto-Ấn-Iran (2000 TCN)
Tiền-German và Tiền-Balt-Slav;[25] proto-German khoảng 500 TCN[26]
Khi tiếng Proto-Ấn-Âu (PIE) bắt đầu phân tách thành các nhánh con, hệ thống âm thanh của nó cũng bắt đầu thay đổi theo các quy luật âm thanh khác nhau, được minh chứng trong các ngôn ngữ con sau này.
Hệ thống âm vị PIE rất phức tạp, sở hữu 15 phụ âm dừng, bao gồm sự phân biệt bất thường giữa ba âm kêu là các âm dừng vô thanh, hữu thanh và "hữu thanh bật hơi", và sự phân biệt bất thường giữa ba loại phụ âm ngạc mềm (âm loại k) là "âm vòm" ḱ ǵ ǵh, "ngạc mềm thường" k g gh và ngạc mềm-môi kʷ gʷ gʷh. (Tính chính xác của các thuật ngữ âm vòm và ngạc mềm thường còn bị tranh cãi) Tất cả các ngôn ngữ con đều tiêu giảm số lượng khác biệt giữa các âm thanh này theo những con đường khác nhau.
Ví dụ tiếng Anh thuộc ngữ tộc German, thể hiện các thay đổi ngữ âm sau đây:
Giống như trong các ngôn ngữ centum khác, các âm dừng "ngạc mềm thường" và "vòm/ngạc cứng" hợp nhất, giảm số lượng âm dừng từ 15 xuống còn 12.
Giống như trong các ngôn ngữ German khác, sự chuyển đổi âm thanh German đã thay đổi cách phát âm của tất cả các phụ âm dừng, với mỗi phụ âm chuyển sang một phụ âm khác:
bʰ → b → p → f
dʰ → d → t → θ
gʰ → g → k → x (Âm đầu x sau này →h)
gʷʰ → gʷ → kʷ → xʷ (Âm đầu xʷ sau này →hʷ)
Mỗi phụ âm gốc bị dịch chuyển một bước về bên phải. Ví dụ, âm dʰ gốc trở thành âm d, còn âm d gốc lại trở thành âm t và âm t gốc lại trở thành âm θ (phát âm chữ th trong từ "thin" của tiếng Anh). Đây là lí do trong tiếng Anh các chữ f, th, h và wh lại được phát âm như hiện giờ. Các ví dụ sau đây so sánh tiếng Anh với tiếng La-tinh, một ngôn ngữ không có biển chuyển gì nhiều về mặt ngữ âm:
Âm PIE p: piscis "cá" so với fish; pēs, pēdis "chân" so với foot; pluvium "mưa" so với flow; pater "cha" so với father
Âm PIE t: trēs "ba" so với three; māter "mẹ" so với mother
Âm PIE d: decem "mười" so với ten; pēdis "chân" so với foot; quid "gì" so với what
Âm PIE k: centum "trăm" so với hund(red); capere "lấy" so với have
Âm PIE kʷ: quid "gì" so với what; quandō "khi nào" so với when
Phụ âm ở giữa và cuối một từ sau này tiếp tục thay đổi:
Các âm dừng hữu thanh đã biến âm từ trước bị mềm hóa và chuyển thành các âm xát.
Định luật Verner biến các âm xát vô thanh đã biến âm từ trước thành các âm xát hoặc âm dừng hữu thanh. Đây là lí do tại sao âm t trong từ centum của tiếng Latinh tương đương với âm d trong từ hund(red) thay vì phải là âm th theo quy luật biến âm trước tiên đoán.
Hầu hết các âm h còn lại bị tiêu biến, còn các âm f và th còn sót lại trở thành các âm hữu thanh. Ví dụ, decem của Latinh tương đương với ten của tiếng Anh mà không có âm h ở giữa (ta có từ taíhun "mười" trong tiếng Gothic, một ngôn ngữ German đã tuyệt chủng). Tương tự, từ seven "bảy" và have "có" sở hữu âm v hữu thanh (so với các từ Latinh septem và capere), trong khi đó từ father "cha" và mother "mẹ" sở hữu âm th hữu thanh (so với các từ Latinh pater và māter).
^Nordhoff, Sebastian; Hammarström, Harald; Forkel, Robert; Haspelmath, Martin biên tập (2013). “Indo-European”. Glottolog. Leipzig: Max Planck Institute for Evolutionary Anthropology.
^Lỗi chú thích: Thẻ <ref> sai; không có nội dung trong thẻ ref có tên chang
^Elsie, Robert (2005). “Theodor of Shkodra (1210) and Other Early Texts”. Albanian Literature: A Short History. New York/Westport/London: I.B.Tauris. tr. 5.
^Nhà ngôn học Eric Hamp ủng hộ giả thuyết tiếng Illyria thuộc về nhóm Tây bắc, cho rằng tiếng Albania là hậu duệ của tiếng Illyria và tiếng Albania có quan hệ với tiếng Messapia, một phương ngữ Illyria (Comparative Studies on Albanian, 2007).
^Curtis, Matthew Cowan (ngày 30 tháng 11 năm 2011). Slavic–Albanian Language Contact, Convergence, and Coexistence (bằng tiếng Anh). ProQuest LLC. tr. 18. ISBN978-1-267-58033-7. Truy cập ngày 31 tháng 3 năm 2017. So while linguists may debate about the ties between Albanian and older languages of the Balkans, and while most Albanians may take the genealogical connection to Illyrian as incontrovertible, the fact remains that there is simply insufficient evidence to connect Illyrian, Thracian, or Dacian with any language, including Albanian (Cho nên các nhà ngôn ngữ có thể tiếp tục tranh luận về mối liên hệ giữa tiếng Albania và các ngôn ngữ cổ hơn vùng Balka, và người dân Albania có thể cứ tiếp tục cho rằng quan hệ họ hàng của chúng là không thể chỗi cái, sự thật vẫn là ta không có đủ bằng chứng để kết nối tiếng Illyria, Thrace, hoặc Dacia với bất kì ngôn ngữ nào, kể cả tiếng Albania)
^Mark, Joshua J. (ngày 28 tháng 4 năm 2011). “Mitanni”. Ancient History Encyclopedia.
^David W. Anthony, "Two IE phylogenies, three PIE migrations, and four kinds of steppe pastoralism", Journal of Language Relationship, vol. 9 (2013), tr. 1–22
^Kruta, Venceslas (1991). The Celts. Thames and Hudson. tr. 54.
^Fine, John (1985). The ancient Greeks: a critical history. Harvard University Press. p. 72. ISBN978-0-674-03314-6. "Most scholars now believe that the Sicans and Sicels, as well as the inhabitants of southern Italy, were basically of Illyrian stock superimposed on an aboriginal 'Mediterranean' population."
^Michel Lejeune (1974), Manuel de la langue vénète. Heidelberg: Indogermanische Bibliothek, Lehr- und Handbücher.[cần số trang]
Auroux, Sylvain (2000). History of the Language Sciences. Berlin: Walter de Gruyter. ISBN978-3-11-016735-1.
Fortson, Benjamin W. (2004). Indo-European Language and Culture: An Introduction. Malden, Massachusetts: Blackwell. ISBN978-1-4051-0315-2.
Brugmann, Karl (1886). Grundriss der Vergleichenden Grammatik der indogermanischen Sprachen (bằng tiếng Đức). Erster Band. Strassburg: Karl J. Trübner.
Houwink ten Cate, H.J.; Melchert, H. Craig & van den Hout, Theo P.J. (1981). “Indo-European languages, The parent language, Laryngeal theory”. Encyclopædia Britannica. 22 (ấn bản thứ 15). Chicago: Helen Hemingway Benton.
Holm, Hans J. (2008). “The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages”. Trong Preisach, Christine; Burkhardt, Hans; Schmidt-Thieme, Lars; và đồng nghiệp (biên tập). Data Analysis, Machine Learning, and Applications. Proceedings of the 31st Annual Conference of the German Classification Society (GfKl), University of Freiburg, March 7–9, 2007. Heidelberg-Berlin: Springer-Verlag. ISBN978-3-540-78239-1.
Kortlandt, Frederik (1988). “The Thraco-Armenian consonant shift”. Linguistique Balkanique. 31: 71–74.
Lane, George S.; Adams, Douglas Q. (1981). “The Tocharian problem”. Encyclopædia Britannica. 22 (ấn bản thứ 15). Chicago: Helen Hemingway Benton.
Porzig, Walter (1954). Die Gliederung des indogermanischen Sprachgebiets. Heidelberg: Carl Winter Universitätsverlag.
Renfrew, C. (2001). “The Anatolian origins of Proto-Indo-European and the autochthony of the Hittites”. Trong Drews, R. (biên tập). Greater Anatolia and the Indo-Hittite language family. Washington, DC: Institute for the Study of Man. ISBN978-0-941694-77-3.
“Indo-European Roots Index”. The American Heritage Dictionary of the English Language . Internet Archive: Wayback Machine. ngày 22 tháng 8 năm 2008 [2000]. Bản gốc lưu trữ ngày 17 tháng 2 năm 2009. Truy cập ngày 9 tháng 12 năm 2009.
Köbler, Gerhard (2014). Indogermanisches Wörterbuch (bằng tiếng Đức) (ấn bản thứ 5). Gerhard Köbler. Truy cập ngày 29 tháng 3 năm 2015.