Trong toán tổ hợp, số Catalan là dãy các số tự nhiên xuất hiện trong nhiều bài toán đếm, thường bao gồm những đối tượng đệ quy. Chúng được đặt tên theo nhà toán học BỉEugène Charles Catalan (1814–1894).
Số Catalan thứ n được định nghĩa như sau:
Những số catalan đầu tiên với n = 0, 1, 2, 3, …là:
nó tương đương với biểu thức bên trên vì . Công thức này cho thấy Cn là một số nguyên, mà ta không thể thấy được trong công thức đầu tiên. Biểu thức này hình thành nền tảng cho bài chứng minh sự đúng đắn của công thức.
Số catalan thỏa mãn hệ thức truy hồi sau:
(phát biểu thành lời vế trái: tổng của tất cả tích của các số catalan có tổng chỉ số bằng n)
và
Một cách gần đúng, số Catalan có thể tính bằng:
Ý nghĩa của biểu thức trên là thương khi chia số Catalan thứ n cho biểu thức bên phải sẽ tiến tới 1 khi . Một vài tài liệu chỉ viết rằng .[1]. Điều này có thể chứng minh bằng cách dùng phép tính xấp xỉ của Stirling với n!, hoặc thông qua các hàm sinh.
Chỉ những số Cn có n = 2k − 1 là số lẻ. Còn lại đều là số chẵn.
Chỉ có 2 số Catalan là số nguyên tố: C2 = 2 và C3 = 5.[citation needed]
Số Catalan có cách biểu diễn khác dưới dạng tích phân:
trong đó Nghĩa là số Catalan là lời giải của bài toán mômen Hausdorff trên đoạn [0, 4] thay vì [0, 1].
Có nhiều bài toán tổ hợp mà kết quả là số Catalan. Quyển Enumerative Combinatorics: Volume viết bởi nhà toán học tổ hợp Richard P. Stanley gồm 66 bài toán với 66 cách diễn giải khác nhau về số Catalan. Sau đây là một số ví dụ, minh họa trường hợp C3 = 5 và C4 = 14.
Cn là số từ Dyck[2] với độ dài 2n. Một từ Dyck là một chuỗi ký tự gồm n ký tự X và n ký tự Y, trong đó không có đoạn đầu nào của chuỗi có nhiều ký tự Y hơn so với X. Ví dụ các từ Dyck độ dài 6:
XXXYYY XYXXYY XYXYXY XXYYXY XXYXYY.
Biểu diễn lại các từ Dyck, thay X bằng dấu mở ngoặc và Y bằng dấu đóng ngoặc, Cn đếm số biểu thức chứa n cặp dấu ngoặc đúng:
((())) ()(()) ()()() (())() (()())
Cn cũng là số cách khác nhau để đặt dấu ngoặc giữa n+1 phần tử (hay là số cách để sắp xếp n phép khai triển của một toán tử 2 ngôi). Ví dụ, với n = 3, chúng ta có 5 cách khác nhau để chia 4 phần tử:
((ab)c)d (a(bc))d (ab)(cd) a((bc)d) a(b(cd))
Phép khai triển liên tiếp của một toán tử 2 ngôi có thể biểu diễn dưới dạng một cây nhị phân đầy đủ (một cây nhị phân là đầy đủ nếu mỗi nút đều có 2 hoặc không có nút con). Dẫn đến Cn là số cây nhị phân đầy đủ có n+1 lá:
Cn là số cây có thứ tự, không giống nhau (về mặt hình học) có n nút. (Một cây có thứ tự là một cây có gốc mà các nút con của mỗi nút đều được đánh thứ tự từ trái qua phải)[3]
Cn là số đường đi đơn điệu dọc theo các cạnh trên một lưới có n × n ô vuông, mà không đi lên khỏi đường chéo. Một đường đi đơn điệu là một đường đi bắt đầu từ góc dưới bên trái, kết thúc ở góc trên bên phải, chỉ đi theo hướng qua phải hoặc đi lên. Đếm số đường đi cũng tương tự đếm từ Dyck: X biểu thị cho "qua phải" và Y biểu thị cho "đi lên".
Ảnh minh họa cho trường hợp n = 4:
Có thể biểu diễn lại bằng cách liệt kê các phần tử Catalan theo độ cao cột:[4]
Cn là số cách khác nhau để chia một đa giác lồi có n+2 cạnh thành các tam giác bằng cách nối các đỉnh của đa giác lại mà không cắt nhau (một dạng của phép đạc tam giác từ đa giác). Bên dưới là minh họa các lục giác với n = 4:
Cn là số hoán vị sắp xếp được trên ngăn xếp của dãy {1,..., n}. Một hoán vị sắp xếp được trên ngăn xếp nếu S(w) = (1, ..., n), khi S(w) được xác định như sau: viết w = unv trong đó n là phần tử lớn nhất trong w và u và v ở thứ tự thấp hơn, và tập S(w) = S(u)S(v)n, với S được xem như là dãy một phần tử. Đây là những hoán vị tránh từ 231.
Cn số hoán vị của {1, ..., n} tránh mẫu hình 123 (hoặc bất kỳ mẫu hình có độ dài 3); có nghĩa là số hoán vị mà không có bất ký 3 ký tự tăng dần. Với n = 3, những hoán vị là 132, 213, 231, 312 and 321. Với n = 4, chúng là 1432, 2143, 2413, 2431, 3142, 3214, 3241, 3412, 3421, 4132, 4213, 4231, 4312 and 4321.
Cn là số cách phân chia không cắt nhau của tập {1, ..., n}. Tất nhiên,Cn không bao giờ lớn hơn số Bell thứ n. Cn cũng là số cách phân tập không cắt nhau của {1, ..., 2n} trong trường hợp mỗi khối kích cỡ 2.
Cn là số cách dựng hình bậc thang độ cao n với n hình chữ nhật. Hình dưới đây minh họa trường hợp n = 4:
Cn là số cây nhị phân có gốc với n nút trong (n+1 lá). Minh họa trong biểu độ bên dưới là những cây với n = 0,1,2 và 3. Kết quả là 1, 1, 2, và 5 theo thứ tự. Ở đây, chúng ta xét những cây mà mỗi nút có 2 hoặc không có nút con. Những nút bên trong là những nút có 2 nút con..
Cn là số cách để vẽ hình núi với n nét lên và n nút xuống (không vượt xuống đường biên dưới). Tức là dãy núi không thấp hơn đường chân trời.
Cn là số hoạt cảnh của một hình của chữ nhật 2-n. Nói cách khác, là số cách xếp các số 1, 2,... và một hình chữ nhật 2-n mà mỗi hàng và mỗi cột để tăng. Như vậy, công thức được rút ra từ một trường hợp đặc biệt của công thức độ dài Hook
Cn is the number of ways that the vertices of a convex 2n-gon can be paired so that the line segments joining paired vertices do not intersect. This is precisely the condition that guarantees that the paired edges can be identified (sewn together) to form a closed surface of genus zero (a topological 2-sphere). (tạm dịch: C_n là số cách để ghép cặp các đỉnh của một đa giác lồi có 2n đỉnh sao cho những đoạn thẳng nối các cặp đỉnh không giao nhau. Đây chính xác là điều kiện đủ để chỉ ra những cạnh nối có thể hình thành một mặt phẳng genus không kín (khối lưỡng cầu tôpô))
Cn is the number of semiorders on n unlabeled items.[5]
^Cormen, Thomas H.; Leiserson, Charles E.; Rivest, Ronald L. (1990). “Dynamic Programming”. Introduction to Algorithms. Cambridge, Massachusetts: The MIT Press. tr. 304. ISBN0262031418.
^Kim, K. H.; Roush, F. W. (1978), “Enumeration of isomorphism classes of semiorders”, Journal of Combinatorics, Information &System Sciences, 3 (2): 58–61, MR0538212.