Otto Dempwolff, một học giả người Đức, là nhà nghiên cứu đầu tiên đã khảo sát một cách rộng rãi Ngữ hệ Nam Đảo bằng cách sử dụng phương pháp so sánh. Một học giả người Đức khác là Wilhelm Schmidt, đã đặt ra từ tiếng Đứcaustronesisch[2] bắt nguồn từ tiếng Latinhauster "gió nam" cộng với tiếng Hy Lạpnêsos "đảo". Đúng như tên gọi, phần lớn Ngữ hệ Nam Đảo được nói trên các hòn đảo, chỉ có một vài ngôn ngữ, như tiếng Mã Lai và nhóm ngôn ngữ Chăm là các ngôn ngữ bản địa tại lục địa châu Á. Nhiều ngôn ngữ Nam Đảo chỉ có rất ít người nói, song các ngôn ngữ Nam Đảo chính có hàng chục triệu người nói và đặc biệt, tiếng Mã Lai có đến 180 triệu người nói và là ngôn ngữ được nói nhiều thứ tám trên thế giới. Khoảng hơn hai mươi ngôn ngữ Nam Đảo là ngôn ngữ chính thức của các quốc gia.
Các nguồn khác nhau đưa ra số lượng các ngôn ngữ khác nhau, song Nam Đảo và Niger–Congo là hai ngữ hệ lớn nhất trên thế giới về số lượng ngôn ngữ, mỗi ngữ hệ chiếm khoảng một phần năm tổng số ngôn ngữ được ước tính trên thế giới. Phạm vi địa lý của Ngữ hệ Nam Đảo lớn hơn bất kỳ ngữ hệ nào khác trước khi Ngữ hệ Ấn-Âu mở rộng phạm vi trong thời kỳ thuộc địa. Ngữ hệ Nam Đảo kéo dài từ Madagascar ở ngoài khơi đông nam châu Phi đến đảo Phục Sinh ở phía đông của Thái Bình Dương. Tiếng Hawaii, tiếng Rapa Nui, và tiếng Malagasy (nói tại Madagascar) là các ngôn ngữ phân bổ ở những vùng địa lý xa nhất của Ngữ hệ Nam Đảo.
Theo Robert Blust (1999), Ngữ hệ Nam Đảo được chia thành một số nhánh chính, ngoại trừ một nhánh duy nhất thì tất cả các nhánh còn lại đều ở Đài Loan. Nhóm ngôn ngữ Formosa tại Đài Loan được phân thành 9 phân nhóm bậc đầu tiên của Ngữ hệ Nam Đảo. Toàn bộ các ngôn ngữ Nam Đảo được nói bên ngoài Đài Loan (bao gồm tiếng Yami ở ngoài khơi của đảo) thuộc nhánh Malayo-Polynesia, thỉnh thoảng được gọi là Ngoài-Formosa.
Không dễ để khái quát về các ngôn ngữ của một ngữ hệ đa dạng như Nam Đảo. Ngữ hệ này được nói trên một phạm vi rộng rãi, các ngôn ngữ Nam Đảo có thể được chia thành ba nhóm ngôn ngữ: các ngôn ngữ kiểu Philippines, các ngôn ngữ kiểu Indonesia và kiểu hậu Indonesia (Ross 2002).
Các ngôn ngữ Nam Đảo có xu hướng sử dụng điệp từ (lặp lại tất cả hoặc một phần của một từ, như wiki-wiki hay agar-agar), và, giống như các ngôn ngữ Đông và Đông Nam Á khác, hầu hết chúng có phương pháp tổ hợp ngữ âm rất hạn chế, với các âm vị thường có số lượng hạn chế và phần lớn là các âm tiết phụ âm-nguyên âm.
Ngữ hệ Nam Đảo được hình thành theo phương pháp so sánh ngôn ngữ dựa trên cơ sở từ cùng nguồn gốc, các tập hợp từ tương tự trong cách phát âm và ý nghĩa có thể thể hiện chúng có nguồn gốc từ những từ tổ tiên giống nhau trong tiếng Nam Đảo nguyên thủy theo quy tắc thông thường. Một số tập hợp từ cùng gốc rất ổn định. Từ mắt trong nhiều ngôn ngữ Nam Đảo là mata (các ngôn ngữ Nam Đảo xa nhất về phía bắc miền Bắc, nhóm ngôn ngữ Formosa như tiếng Bunun và tiếng Amis đến phía nam như tiếng Maori). Các từ khác có khó khăn hơn để xây dựng mối liên hệ. Từ hai cũng là một từ ổn định, nó xuất hiện trên toàn bộ phạm vi của các ngôn ngữ Nam Đảo, song một số dạng (tiếng Bunun rusya, lusha; tiếng Amis tusa; tiếng Māori tua, rua) yêu cầu cần phải được một số chuyên gia ngôn ngữ học công nhận. Cơ sở dữ liệu từ vựng cơ bản Nam Đảo đưa ra một danh sách từ cho xấp xỉ 500 ngôn ngữ Nam Đảo[3].
Các ngôn ngữ Nam Đảo có kết cấu nột bộ phức tạp. Ngữ hệ gồm có nhiều ngôn ngữ tương tự và có liên hệ chặt chẽ với một số lượng lớn các phương ngữ liên tục, khiến việc xác định ranh giới ngôn ngữ giữa các nhánh gặp khó khăn. Tuy nhiên, có điều rõ ràng là tính đa dạng lớn nhất trong phả hệ ngôn ngữ là nhóm ngôn ngữ Formosa tại Đài Loan, và đây cũng là đảo có ngôn ngữ đa dạng nhất tại Thái Bình Dương, điều này ủng hộ luận điểm ngữ hệ Nam Đảo bắt nguồn từ Đài Loan hay Trung Quốc đại lục. Phân loại toàn diện đầu tiên để phản ánh điều này là Dyen (1965).
Các bài viết chuyên đề về việc phân loại các ngôn ngữ Formosa và, bằng cách mở rộng, cấu trúc cấp cao nhất của Ngữ hệ Nam Đảo—là Blust (1999). Các học giả chuyên nghiên cứu về ngôn ngữ Formosa còn tranh luận về một số đặc điểm, và vẫn còn là vấn đề để các nhà ngôn ngữ học hiện đại nghiên cứu. Nhóm ngôn ngữ Malayo-Polynesia thường được xếp vào trong nhánh Đông Formosa của Blust do chúng chia sẻ việc đồng nhất âm Nam Đảo nguyên thủy *t, *C thành /t/ và *n, *N thành /n/, chúng thay đổi *S thành /h/, và các tư vựng như *lima "năm" mà không được chứng thực trong các ngôn ngữ Formosa khác.
Ngoài Malayo-Polynesia, mười ba nhóm ngôn ngữ Formosa được chấp thuận rộng rãi. Cuộc tranh luận giữa các nhà ngôn ngữ học chủ yếu xoay quanh mối quan hệ giữ các ngữ hệ này. Trong một số phương pháp phân loại được trình bày trong bài, Blust (1999) liên kết hai ngữ hệ vào nhóm Đồng bằng miền Tây, hai hệ nữa vào nhóm Tây Bắc Formosa, và ba hệ nữa vào nhóm Đông Formosa, trong khi Lý Nhâm Quý (2008)Lỗi harv: không có mục tiêu: CITEREFLý_Nhâm_Quý2008 (trợ giúp) liên kết năm hệ vào một nhóm Bắc Formosa. Cơ sở dữ liệu từ vựng cơ bản Nam Đảo (2008) chấp thuận nhóm phía Bắc, từ chối nhóm phía Đông, liên kết Tsou và Rukai (hai ngôn ngữ khác nhau khá lớn), và liên kết nhóm Malayo-Polynesia với nhóm Paiwan thành nhóm Paiwan. Ross (2009)Lỗi harv: không có mục tiêu: CITEREFRoss2009 (trợ giúp) chia tách nhóm Tsou, và lưu ý rằng Tsou, Rukai, và Puyama nằm ngoài việc phục dựng lại tiếng Nam Đảo nguyên thủy.
Các nghiên cứu khác trình bày về bằng chứng âm vị học để bác bỏ việc nhóm Paiwan gồm Paiwan, Puyuma, Bunun, Amis, và Malayo-Polynesia, song điều này không được phản ánh trong từ vựng. Những người nói tiếng Đông Formosa như Basay, Kavalan, và Amis cùng chia sẻ một câu chuyện rằng họ có nguồn gốc từ một hòn đảo gọi là Sinasay hay Sanasay (Li 2004). Người Ami, đặc biệt, vẫn duy trì quan niệm rằng họ đến từ phía đông, và bị người Puyuma đối xử như là một nhóm phục tùng (Taylor 1888).[4]
Cách phân loại của Lý giữ lại nhóm Đông Formosa của Blust, và kết hợp hai ngữ hệ miền Bắc khác. Lý Nhâm Quý đề xuất một tổ tiên ngôn ngữ Formosa nguyên thủy (F0) tương đương với Nam Đảo nguyên thủy (PAN), theo mô hình của Starosta (1995).[5][6] Rukai và Tsou được xem là rất khác biệt,[5] mặc dù vị trí của nhóm Rukai là điều gây tranh cãi.[7]
Nghiên cứu này giữ nhóm Bắc Formosa của Lý Nhâm Quý, song tách nhóm Đông Formosa của Blust, và đề xuất Paiwan có thể là nhóm gần nhất với Malayo-Polynesia. Nó cũng kết hợp Tsou và Rukai, hai ngôn ngữ khác biệt nhất theo Lý Nhâm Quý.
Năm 2009, Malcolm Ross đã đề xuất một cách phân loại mới cho Ngữ hệ Nam Đảo dựa trên bằng chứng hình thái học từ các ngôn ngữ Formosa khác nhau.[8] Ông đề xuất rằng hiện nay thì việc tái dựng ngôn ngữ Nam Đảo nguyên thủy thực sự tương ứng với một giai đoạn trung gian, mà ông gọi với thuật ngữ "Nam Đảo hạt nhân nguyên thủy". Đáng chú ý, cách phân loại của Ross không ủng hộ tính thống nhất của nhóm ngôn ngữ Tsou, thay vào đó, ông coi nhóm ngôn ngữ Nam Tsou gồm Kanakanavu và Saaroa là một nhánh riêng biệt. Điều này ủng hộ tuyên bố của Chang (2006) rằng Tsou không phải là một nhóm hợp lý.[9]
^"Người Tipun... chắc chắn là hậu duệ từ những người di cư, và tôi cũng không khỏi nghi ngờ rằng dân Amia có nguồn gốc tương tự; chỉ là sau này, và chắc hẳn là từ Mejaco Simas [tức là, Miyako-jima], một nhóm các đảo tọa lạc 110 dặm Anh phía Đông Bắc.... Theo những thông tin thu thập được từ những kẻ man rợ Pilam, những người hòa trộn với Tipun, là những người đầu tiên định cư trên những thảo nguyên; rồi tới dân Tipun, và lâu sau đó là dân Amia. Người Tipun, trong một quãng thời gian ngắn, tôn sùng Tù trưởng Pilam, nhưng rồi đồng hóa chức tù trưởng và người dân, trên thực tế vết tích duy nhất còn lại của họ bây giờ, là một vài từ vựng độc lạ ở làng Pilam, một trong số chúng, makan (ăn), là từ thuần Malay. Người Amia quy phục trước người Tipun."
^ abLi, Paul Jen-kuei. 2008. "Time perspective of Formosan Aborigines." In Sanchez-Mazas, Alicia ed. Past human migrations in East Asia: matching archaeology, linguistics and genetics. Taylor & Francis US.
^Starosta, S. 1995. "A grammatical subgrouping of Formosan languages." In P. Li, Cheng-hwa Tsang, Ying-kuei Huang, Dah-an Ho, and Chiu-yu Tseng eds. Austronesian Studies Relating to Taiwan, pp. 683–726, Taipei: Institute of History and Philology, Academia Sinica.
^"The position of Rukai is the most controversial: Tsuchida... treats it as more closely related to Tsouic languages, based on lexicostatistic evidence, while Ho... believes it to be one of the Paiwanic languages, i.e. part of my Southern group, as based on a comparison of fourteen grammatical features. In fact, Japanese anthropologists did not distinguish between Rukai, Paiwan and Puyuma in the early stage of their studies" (Li 2008: 216).
^Ross, Malcolm. 2009. "Proto Austronesian verbal morphology: A reappraisal." In Alexander Adelaar and Andrew Pawley (eds.). Austronesian historical linguistics and culture history: a festschrift for Robert Blust. Canberra: Pacific Linguistics.
^Chang, Henry Yungli. 2006. "Rethinking the Tsouic Subgroup Hypothesis: A Morphosyntactic Perspective." In Chang, H., Huang, L. M., Ho, D. (eds.). Streams converging into an ocean: Festschrift in honor of Professor Paul Jen-Kuei Li on his 70th birthday. Taipei: Institute of Linguistics, Academia Sinica.
Bellwood, Peter (1998). “Taiwan and the Prehistory of the Austronesians-speaking Peoples”. Review of Archaeology. 18: 39–48.
Bellwood, Peter; Fox, James; Tryon, Darrell (1995). The Austronesians: Historical and comparative perspectives. Department of Anthropology, Australian National University. ISBN0-7315-2132-3.
Blundell, David. “Austronesian Dispersal”. Newsletter of Chinese Ethnology. 35: 1–26.
Blust, Robert (1985). “The Austronesian Homeland: A Linguistic Perspective”. Asian Perspectives. 26: 46–67.
Blust, Robert (1999). “Subgrouping, circularity and extinction: some issues in Austronesian comparative”. Trong Zeitoun, E.; Li, P.J.K (biên tập). Selected papers from the Eighth International Conference on Austronesian Linguistics. Taipei: Academia Sinica. tr. 31–94.
Dyen, Isidore (1965). “A Lexicostatistical classification of the Austronesian languages”. International Journal of American Linguistics (Memoir 19).
Fox, James J. (19–20 tháng 8 năm 2004). Current Developments in Comparative Austronesian Studies(PDF). Symposium Austronesia Pascasarjana Linguististik dan Kajian Budaya. Universitas Udayana, Bali. Bản gốc(PDF) lưu trữ ngày 12 tháng 10 năm 2006. Truy cập ngày 20 tháng 9 năm 2012.Quản lý CS1: ngày tháng và năm (liên kết)
Fuller, Peter (2002). “Reading the Full Picture”. Asia Pacific Research. Canberra, Australia: Research School of Pacific and Asian Studies. Bản gốc lưu trữ ngày 27 tháng 9 năm 2011. Truy cập ngày 28 tháng 7 năm 2005.
Li, Paul Jen-kuei (2004). “Origins of the East Formosans:Basay, Kavalan, Amis, and Siraya”. Language and Linguistics. 5 (2): 363–376.
Li, Paul Jen-kuei (17–20 tháng 1 năm 2006). The Internal Relationships of Formosan Languages(PDF). Tenth International Conference on Austronesian Linguistics (ICAL). Puerto Princesa City, Palawan, Philippines.Quản lý CS1: ngày tháng và năm (liên kết)
Peiros, Ilia (June 10–13, 2004). Austronesian: What linguists know and what they believe they know. the workshop on Human migrations in continental East Asia and Taiwan. Geneva.Quản lý CS1: ngày tháng và năm (liên kết)
Ross, John (2002). “Final words: research themes in the history and typology of western Austronesian languages”. Trong Wouk, Fay; Ross, Malcolm (biên tập). The history and typology of Western Austronesian voice systems. Canberra: Pacific Linguistics. tr. 451–474.
Taylor, G. (1888). “A ramble through southern Formosa”. The China Review. 16: 137–161.
Terrell, John Edward (2004). “Introduction: 'Austronesia' and the great Austronesian migration”. World Archaeology. 36 (4): 586–590. doi:10.1080/0043824042000303764.
Thurgood, Graham (1999). “From Ancient Cham to Modern Dialects. Two Thousand Years of Language Contact and Change. Oceanic Linguistics Special Publications No. 28”. Honolulu: University of Hawai'i Press. Chú thích journal cần |journal= (trợ giúp)
Wouk, Fay and Malcolm Ross, eds. (2002), The history and typology of western Austronesian voice systems. Pacific Linguistics. Canberra: Australian National University.
Blust, R. A. (1983). Lexical reconstruction and semantic reconstruction: the case of the Austronesian "house" words. Hawaii: R. Blust.
Cohen, E. M. K. (1999). Fundaments of Austronesian roots and etymology. Canberra: Pacific Linguistics. ISBN 0-85883-436-7
Marion, P., Liste Swadesh élargie de onze langues austronésiennes, éd. Carré de sucre, 2009
Pawley, A., & Ross, M. (1994). Austronesian terminologies: continuity and change. Canberra, Australia: Dept. of Linguistics, Research School of Pacific and Asian Studies, The Australian National University. ISBN 0-85883-424-3
Sagart, Laurent, Roger Blench, and Alicia Sanchez-Nazas (Eds.) (2004). The peopling of East Asia: Putting Together Archaeology, Linguistics and Genetics. London: RoutledgeCurzon. ISBN 0-415-32242-1.
Tryon, D. T., & Tsuchida, S. (1995). Comparative Austronesian dictionary: an introduction to Austronesian studies. Trends in linguistics, 10. Berlin: Mouton de Gruyter. ISBN 110127296
Wolff, John U., "Comparative Austronesian Dictionary. An Introduction to Austronesian Studies", Language, vol. 73, no. 1, pp. 145–56, Mar 1997,ISSN-0097-8507