Từ vựng tiếng Việt là một trong ba thành phần cơ sở của tiếng Việt, bên cạnh ngữ âm và ngữ pháp. Từ vựng tiếng Việt là đối tượng nghiên cứu cơ bản của ngành từ vựng học tiếng Việt, đồng thời cũng là đối tượng nghiên cứu gián tiếp của các ngành ngữ pháp học tiếng Việt, ngữ âm học tiếng Việt, phong cách học tiếng Việt, từ điển học tiếng Việt... Ngành từ vựng học tiếng Việt nghiên cứu về các khía cạnh của từ vựng tiếng Việt cũng chỉ phát triển mạnh trong giai đoạn gần đây.
Ngày nay, ngoài các từ tiếng Việt mượn của tiếng Hán hoặc các tiếng Ấn-Âu thì tất cả các từ còn lại được coi là các từ thuần Việt. Những từ được gọi là từ thuần Việt này thường là bộ phận từ vựng gốc của tiếng Việt, biểu thị các sự vật, hiện tượng, khái niệm cơ bản nhất và tồn tại từ rất lâu. Nếu so sánh các từ trong bộ phận thuần Việt này với các từ tương ứng trong tiếng Mường, các tiếng Tày-Thái, Môn-Khmer, người ta thấy chúng có sự giống nhau nhất định về ngữ âm và ngữ nghĩa. Từ đó, các nhà ngôn ngữ học đã đưa ra ba giả thuyết chủ yếu sau về nguồn gốc của tiếng Việt:
Nếu coi từ thuần Việt là kết quả của quá trình tiếp xúc, tác động lâu dài giữa các ngôn ngữ Nam Á và ngôn ngữ Tày-Thái thì các từ này hình thành nên một lớp từ vựng cơ bản và lâu đời nhất trong tiếng Việt, có thể chia ra như sau:
Trong giai đoạn mà chữ Quốc ngữ chưa có, từ thuần Việt chỉ có thể ghi bằng chữ Nôm.
Sự tiếp xúc giữa tiếng Việt và tiếng Hán bắt đầu khi nhà Hán của Trung Quốc xâm chiếm nước Việt và thực hiện đồng hóa người Việt trong thời kỳ Bắc thuộc dài hàng ngàn năm. Quá trình tiếp xúc lâu dài này đã đưa vào tiếng Việt một khối lượng từ ngữ rất lớn của tiếng Hán. Hiện tượng này diễn ra khác nhau trong các thời kỳ. Giai đoạn đầu có tính chất lẻ tẻ, rời rạc, chủ yếu thông qua đường khẩu ngữ qua sự tiếp xúc giữa người Việt và người Hán. Đến đời Đường, tiếng Việt mới có sự tiếp nhận các từ ngữ Hán một cách có hệ thống qua đường sách vở. Các từ ngữ gốc Hán này chủ yếu được đọc theo ngữ âm đời Đường tuân thủ nguyên tắc ngữ âm tiếng Việt gọi là âm Hán-Việt. Ví dụ: phiền, phòng, trà, trảm, chủ... Các từ ngữ gốc Hán nhưng không đọc theo âm Hán-Việt ngoài các từ được du nhập vào tiếng Việt trước đời Đường (ví dụ các âm Hán cổ tương ứng với các âm Hán-Việt trên là buồn, buồng, chè, chém, chúa...), cũng cần kể đến những từ xuất phát từ các phương ngữ Trung Quốc khác nhau (như tiếng Quảng Đông, tiếng Triều Châu...) được du nhập thông qua đường khẩu ngữ như: ca la thầu, mì chính, xì dầu, bánh pía, sương sáo, lẩu...
Kể từ khi Việt Nam trở thành thuộc địa của Pháp, tiếng Pháp đã có ảnh hưởng đáng kể đến tiếng Việt và các từ ngữ gốc Pháp thâm nhập khá nhiều vào tiếng Việt, chỉ sau từ Hán-Việt. Sự ảnh hưởng này là do tiếng Pháp được sử dụng trong các văn bản, giấy tờ của Nhà nước và trong giảng dạy ở nhà trường, cũng như trong các loại sách báo khác. Ảnh hưởng này kéo theo sự xuất hiện của nhiều từ gốc Pháp trong nhiều lĩnh vực khác nhau như:
Đồng thời qua tiếng Pháp, một số từ tiếng Anh, tiếng Đức cũng du nhập vào tiếng Việt, ví dụ như: mít tinh, boong ke...
Ngoài ra, ảnh hưởng của Nga cũng dẫn đến sự du nhập của một số từ gốc Nga như: bônsêvích, Xô Viết...
Từ hỗn chủng là sử dụng hỗn hợp của ba loại trên.
Ví dụ:
Việc nghiên cứu các đơn vị từ vựng tiếng Việt được nhiều nhà Việt ngữ học quan tâm và coi là việc quan trọng hàng đầu trong việc nghiên cứu tiếng Việt. Tuy nhiên, các học giả này có ý kiến tương đối khác nhau về cách nhận diện và phân loại từ vựng tiếng Việt. Nhìn chung, đa phần các học giả đều coi những tiếng độc lập, có nghĩa là các từ - từ đơn tiết. Những tiếng không độc lập thì lại được xử lý khác nhau tùy theo học giả.
Nguyễn Kim Thản phân biệt từ thuần, từ pha, từ phức, từ chắp. Đỗ Hữu Châu chia ra từ láy và từ ghép. Nguyễn Văn Tu phân biệt từ đơn và từ ghép, trong đó có từ ghép bao gồm các từ láy mà tác giả coi là từ đơn ghép với chính nó mà thành. Ngoài ra, những học giả này còn thừa nhận sự tồn tại của cụm từ cố định. M. B. Emeneau coi mỗi từ là một âm tiết, một chữ tách rời nhau. Đây cũng là quan điểm của Gabriel Aubaret, Trương Vĩnh Ký, Trương Vĩnh Tống, Trần Trọng Kim, Phạm Duy Khiêm. Theo họ, những đơn vị gọi là từ ghép, cụm từ cố định, cụm từ tự do không rõ ràng.
Đại bộ phận các từ trong tiếng Việt có ba thành tố nghĩa: nghĩa sở chỉ, nghĩa sở biểu và nghĩa kết cấu. Tuy nhiên cũng có những từ chỉ có một hoặc hai loại nghĩa. Ngoài ra, cũng có thể chia các từ về mặt nghĩa thành từ tự nghĩa (bản thân ý nghĩa độc lập) và từ trợ nghĩa (ý nghĩa chỉ bộc lộ rõ khi kết hợp). Nhìn chung có thể phân loại các từ tiếng Việt về mặt nghĩa như sau:
Tự nghĩa | Trợ nghĩa | |
---|---|---|
Có nghĩa sở chỉ, sở biểu và kết cấu | nhà, đẹp, đi (kiểu 1) | |
Có nghĩa sở chỉ và kết cấu | sẽ, tuy, với (kiểu 2) | |
Có nghĩa sở biểu và kết cấu | quốc, thủy, hỏa (kiểu 3) | búa (chợ búa), lẽo (lạnh lẽo) (kiểu 4) |
Có nghĩa kết cấu | bù, nhìn, bồ, hóng (kiểu 5) |
Từ kiểu 3 thường là các từ Hán-Việt.
Cũng như nhiều ngôn ngữ trên thế giới, hiện tượng đa nghĩa trong tiếng Việt cũng có những đặc thù riêng.
Để biểu thị khái niệm mới, tiếng Việt có thiên hướng tạo ra các đơn vị từ vựng mới hơn là phát triển nghĩa của từ vựng có từ trước, đa phần là phát triển các đơn vị từ vựng có hai âm tiết. Số lượng từ vựng có nhiều nghĩa cũng như số nghĩa trong từ đa nghĩa của tiếng Việt đều thấp hơn so với nhiều ngôn ngữ khác.
Hiện tượng đa nghĩa chủ yếu xảy ra ở các từ mà ít ở các ngữ. Các ngữ đa nghĩa thông thường có gốc Hán.
Các từ kiểu 2 (các hư từ) và 4, 5 (đơn thuần nghĩa kết cấu) không có hiện tượng nhiều nghĩa; hiện tượng nhiều nghĩa chỉ xuất hiện ở các từ kiểu 1 (độc lập về nghĩa, hoạt động tự do) và kiểu 3 (độc lập về nghĩa, hoạt động hạn chế). Từ trước đến nay, các nhà Việt ngữ học chủ yếu chú ý hiện tượng nhiều nghĩa của các từ kiểu 1 mà ít chú ý các từ kiểu 3. Ví dụ hiện tượng đa nghĩa đối với các từ kiểu 3:
Sự mở rộng và thu hẹp ý nghĩa của từ vựng tiếng Việt góp phần hình thành các thủ pháp nghệ thuật văn học như ẩn dụ, hoán dụ, ngoa dụ, uyển ngữ, nhã ngữ...
Hiện tượng đồng âm trong tiếng Việt phổ biến hơn các ngôn ngữ Ấn-Âu do âm tiết tiếng Việt gồm 5 thành phần: âm đầu, vần (âm chính, âm cuối và âm đệm) và thanh điệu[3]. Tuy nhiên, không như các ngôn ngữ Ấn-Âu, vì tiếng Việt không biến hình nên chỉ có một loại đồng âm hoàn toàn.
Với quy luật kết hợp ngữ âm của mình, tiếng Việt có thể tạo ra khoảng trên 20.000 âm tiết khác nhau, trong thực tế mới chỉ sử dụng khoảng 6000. Theo Karlgren, số lượng âm tiết tiếng Hán sử dụng chỉ bằng một phần mười của tiếng Việt nên hiện tượng đồng âm trong tiếng Hán phổ biến hơn rất nhiều so với tiếng Việt.
Có 5 kiểu từ khác nhau về nghĩa như trên, nên giữa các kiểu từ có thể xảy ra 14 kiểu quan hệ đồng âm:
Nói chung, hiện tượng đồng âm trong tiếng Việt rất đa dạng nhưng ít gây hiểu lầm, sự hiểu lầm có thể xảy ra ở trường hợp kiểu 1-3 (từ thuần Việt đồng âm với từ Hán-Việt) hoặc kiểu 3-3 (từ Hán-Việt đồng âm với từ Hán-Việt) do các từ kiểu 3 (Hán-Việt) không hoạt động tự do nhưng nghĩa của chúng thường cộng hưởng với nghĩa của từ kết hợp với chúng.
Hiện tượng đồng âm trong tiếng Việt thường thấy trong chơi chữ, ví dụ trong câu đối: da trắng vỗ bì bạch - rừng sâu mưa lâm thâm thì bì bạch có nghĩa là da trắng đồng thời là từ tượng thanh, lâm thâm nghĩa là rừng sâu đồng thời cũng là từ tượng thanh.
Hiện tượng đồng nghĩa trong tiếng Việt chỉ xảy ra ở những từ độc lập về nghĩa, tức là những từ thuộc kiểu 1 và kiểu 3, có thể nói là những từ thuần Việt và từ Hán-Việt. Có ba loại đồng nghĩa sau:
Các từ trái nghĩa trong tiếng Việt thể hiện sự tương phản về nghĩa trên các khía cạnh phản ánh phẩm chất của đối tượng, ví dụ về thời gian (sớm - muộn, sáng - tối, nhanh - chậm...); vị trí (trên - dưới, ngoài - trong, trước - sau...); không gian (đông - tây; ra - vào, xa - gần...)...
Có hai kiểu đối lập chủ yếu trong từ trái nghĩa tiếng Việt:
Các từ trái nghĩa tiếng Việt đa phần gắn liền với tính cân xứng, tức là dung lượng ngữ nghĩa của chúng phải tương đương nhau, ví dụ nhỏ trái nghĩa với to; khổng lồ với tí hon; chứ nhỏ không được coi nhỏ là trái nghĩa của khổng lồ... Tuy nhiên, một từ vẫn có thể tham gia vào nhiều cặp trái nghĩa, ví dụ: mở - đóng (cửa); mở - gấp (vở); mở - đậy (nắp); mở - hạ (màn);...
Đối với từ nhiều nghĩa, mỗi nghĩa cũng có thể có một hoặc vài từ trái nghĩa, ví dụ: cao - thấp (chiều cao); cao - hạ (giá cả);...
Các đơn vị trái nghĩa có thể cấu tạo để tạo thành các cặp từ trái nghĩa, ví dụ: ăn mặn - ăn nhạt; ăn mặn - ăn chay...
Trong tiếng Việt tồn tại phổ biến những nhóm từ gần gũi nhau về mặt âm thanh và ý nghĩa. Ví dụ: bắc và bấc giống nhau ở âm đầu và gió bắc hay gió bấc như nhau, nhưng không hoàn toàn giống nhau vì không thể thay thế phương bắc bằng phương bấc; hoặc các nhóm từ có vần -ép tuy ý nghĩa khác nhau nhưng đều mô phỏng tính chất "sát nhau": dẹp, bẹp, xẹp, lép, khép... Những nhóm từ này gọi là từ tương tự.
Căn cứ vào ngữ âm của từ ngữ, có thể chia từ tương tự trong tiếng Việt thành ba loại:
Căn cứ vào ngữ nghĩa của từ ngữ, có thể chia hiện tượng từ tương tự trong tiếng Việt thành ba loại:
Căn cứ theo phạm vi sử dụng thì có thể chia từ vựng tiếng Việt thành từ vựng toàn dân và từ vựng hạn chế về mặt xã hội và lãnh thổ.
Từ vựng toàn dân là vốn từ dùng chung cho tất cả những người nói tiếng Việt, thuộc các địa phương khác nhau, các tầng lớp xã hội khác nhau.
Từ vựng hạn chế về mặt lãnh thổ gọi là từ địa phương. Từ địa phương tiếng Việt có ba loại:
Từ toàn dân | Hải Dương, Hưng Yên | Thanh Hóa | Nghệ An, Hà Tĩnh | Nam Bộ |
---|---|---|---|---|
cá quả | cá chuối | cá tràu | cá lóc | |
cua | rốc[5] | dam | ||
dứa | gai | thơm, khóm | ||
lợn | ỉn[5] | heo | ||
cây xoan | cây đu | sầu đâu | ||
trâu | tâu[6] | tru | ||
nước | nác | |||
gạo | gấu |
Từ vựng hạn chế về mặt tầng lớp sử dụng gọi là từ (tiếng) lóng. Tiếng lóng của một tầng lớp nào đó là những từ ngữ có tên gọi song song với từ ngữ toàn dân. Từ lóng có thể thường xuyên thay đổi tùy theo môi trường, hoàn cảnh mà tầng lớp xã hội sản sinh ra nó.
Từ ngữ chuyên môn trong tiếng Việt là những từ ngữ sử dụng hạn chế trong một nghề nào đó của xã hội, những người không làm nghề đó có thể ít biết hoặc không biết. Ví dụ, nghề nông có các từ ngữ: cày vỡ, cày ải, bón lót, bón đón đòng, bón thúc, gieo thẳng, gieo vại, lúa chia vè, lúa đứng cái, lúa von...
Ngoài ra trong tiếng Việt còn có nhiều thành ngữ, tục ngữ thể hiện kinh nghiệm, cách thức làm việc... trong nghề nào đó. Ví dụ trong nghề mộc có các câu: mộc gia nề giảm, cắt cưa đóng đanh...
Thuật ngữ trong tiếng Việt bao gồm những từ ngữ là tên gọi chính xác của các khái niệm và đối tượng sử dụng giới hạn trong một lĩnh vực chuyên môn của con người. Ví dụ trong toán học có các thuật ngữ: đạo hàm, tích phân, vi phân... trong ngữ âm học có các thuật ngữ: âm vị, âm tiết, nguyên âm...
Đặc điểm cơ bản của thuật ngữ bao gồm tính chính xác, tính hệ thống, và tính quốc tế.
Dựa theo tần suất sử dụng của từ vựng tiếng Việt thì có thể chia ra hai lớp: từ vựng tích cực và từ vựng tiêu cực. Từ vựng tích cực là những từ ngữ quen thuộc và sử dụng thường xuyên. Từ vựng tiêu cực là những từ ngữ ít dùng hoặc không được dùng thường xuyên, nó bao gồm các từ ngữ mang sắc thái mới, chưa được dùng rộng rãi hoặc những từ ngữ đã lỗi thời.
Dựa theo nguyên nhân làm cho từ vựng lỗi thời có thể chia ra hai loại: từ ngữ cổ và từ ngữ lịch sử. Từ ngữ cổ là những từ ngữ đã biến mất khỏi ngôn ngữ hiện đại hoặc vẫn còn dấu vết trong tiếng Việt hiện đại nhưng ý nghĩa đã bị lu mờ và không còn được dùng độc lập. Ví dụ: trong Túi đã không tiền khôn chác rượu (Quốc âm thi tập) thì chác là mua, khôn là khó...; hoặc như trong Thúc Loan dẻ thằng bé con (Thiên nam ngữ lục) thì dẻ có nghĩa là khinh dẻ...
Khác với từ ngữ cổ, từ ngữ lịch sử không có các từ ngữ đồng nghĩa trong tiếng Việt hiện đại, tuy nhiên khi cần diễn đạt khác khái niệm mang tính chất lịch sử, người ta vẫn phải sử dụng đến chúng. Ví dụ như tên gọi các chức, tước, phẩm, hàm thời phong kiến: án sát, lãnh binh, tuần phủ,.. hay các hình thức thi cử: cử nhân, hoàng giáp, trạng nguyên...
Đa số các từ ngữ mới trong tiếng Việt đều xuất phát từ các ngành khoa học tự nhiên và xã hội, nhanh chóng gia nhập vào lớp từ vựng tích cực toàn dân hoặc thuật ngữ chuyên môn nào đó. Thông thường những từ ngữ mới này được phổ biến nhờ các phương tiện truyền thông đại chúng. Ví dụ như: bộ nhớ, bộ vi xử lý, hệ điều hành, cổ phiếu, sàn giao dịch...
Trước Cách mạng tháng Tám 1945, việc nghiên cứu về từ vựng tiếng Việt còn lẻ tẻ và chưa hệ thống. Sau 1954, từ vựng học tiếng Việt với tư cách một bộ môn ngôn ngữ học thực sự ra đời, thông qua các giáo trình từ vựng học tại hai trường Đại học Tổng hợp Hà Nội và Đại học Sư phạm Hà Nội.
Tại Miền Nam phía nam vĩ tuyến 17 thì Bộ Quốc gia Giáo dục lập nên Ủy ban Quốc gia Soạn thảo Danh từ Chuyên môn để bổ túc và cập nhật hóa từ vựng tiếng Việt khi tiếp cận những học thuật mới.[7]
(tiếng Việt)
(tiếng Đức)
(tiếng Pháp)