Khi máy biết học,… Nhà văn Vu Gia

Khi máy biết học

Khi máy biết học,…

VU GIA

Máy còn biết tự học để hoàn thiện tri thức, để trở nên thông minh hơn, huống gì con người đang sống giữa cõi đời này.

Cách đây mấy năm, trong chuyến viếng thăm Đại học Quốc gia Hoa Kỳ (American National University – ANU), tôi được ông Frank Longaker, Giám đốc ANU cùng ban lãnh đạo nhà trường tiếp đón nồng hậu và tặng cuốn sách Machine Learning của Tom M. Mitchell (WCB/McGraw-Hill, 1977). Ông hy vọng qua cuốn sách này, tôi hiểu thêm về dự phóng của nhân loại ở tương lai gần, giúp tôi đạt kết quả tốt hơn trong nghề viết báo, viết văn, viết nghiên cứu văn học (Tôi đến thăm trường theo lời mời với tư cách nhà báo, nhà văn, học giả). Nhìn qua nhan đề cuốn sách, miệng thì nói cám ơn nhưng trong lòng không hiểu sao ông Frank Longaker nói vậy. Chắc ông không xem thường tôi, bởi một khi đã xem thường thì không mời tôi đến và tiếp đón vui vẻ như thế. Tại sao? Học máy có gì lạ đâu. Ở Việt Nam, rất nhiều người, trong đó có tôi, từng học ngoại ngữ qua băng cassette, qua đĩa CD; đó chẳng phải học máy là gì?

Ý nghĩ thoáng qua và tôi vội “delete” ngay, tiếp tục buổi làm việc.

Học để làm

Tối về nhà khách, tôi thử mở cuốn sách ra xem. Với thứ tiếng Anh tào lao của tôi làm sao có thể “nuốt” được hơn 400 trang sách này? Liếc qua mục lục cùng mấy trang ngẫu hứng, thấy loáng thoáng không phải là “học máy” như tôi nghĩ và như nhan đề cuốn sách: Machine Learning, nhưng nội dung là gì thì chưa nắm được, hy vọng cuối chuyến đi sẽ đến thăm con trai tôi đang làm nghiên cứu sinh ngành Công nghệ thông tin ở ĐH Pittsburgh sẽ rõ hơn.

Bốn ngày cuối cùng còn lại của chuyến đi, con trai đến đón tôi về Pittsburgh. Trên đoạn đường dài hơn 5 tiếng đồng hồ xe chạy từ New York về Pittsburgh, ngoài việc tâm sự của hai cha con, đến điểm dừng chân, tôi đưa cuốn sách Machine Learning cho con tôi xem, thì nó nói đã xem rồi và cho biết tác giả Tom M. Mitchell là GS khá nổi tiếng ở ĐH Carnegie Mellon (CMU). Trường này nổi tiếng nhất là ngành Khoa học máy tính. Sinh viên tốt nghiệp ngành này ở CMU thì rất dễ tìm việc làm và có mức lương cao nhất so với tốt nghiệp ĐH các ngành khác, kể cả một số ngành sau ĐH của các trường ĐH khác trên nước Mỹ. Học phí ở CMU rất cao, nhưng không phải ai có tiền cũng vào học được; dù là trường tư, nhưng mỗi năm họ chỉ tuyển chọn khoảng 20-30% số người nộp đơn.

Trên đường đi, con trai tôi cho biết Machine Learning là một tập con của Trí tuệ nhân tạo (Artificial Intelligence – AI), thuộc về lĩnh vực Khoa học máy tính. Machine Learning là nói về máy có khả năng tự học hỏi trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể. Nói nôm na là con người dạy cho máy học lĩnh vực nào đó để nó phục vụ con người. Máy đánh cờ vua thắng các đại kiện tướng cờ vua trên thế giới đã minh chứng điều ấy.

Bìa cuốn Machine Learning

-Bìa cuốn Machine Learning

Xưa nay, con người học để biết (learning to know) rồi ra đời vận dụng những hiểu biết từ nhà trường đưa vào công việc. Nhưng Machine learning là con người dạy cho máy học để làm (learning to do). Chẳng hạn ở ta, hầu hết những ai đến trường đều thuộc “Mường ThanhHồng CúmHim Lam/ Hoa mơ lại trắng, vườn cam lại vàng” (Tố Hữu, Hoan hô chiến sĩ Điện Biên). Đó là học để biết, chứ không phải học để làm. Học để làm là phải biết “Mường Thanh, Hồng Cúm, Him Lam” ở đâu, diện tích bao nhiêu, dân số bao nhiêu, trình độ dân trí ở đó ra sao?… “Hoa mơ lại trắng, vườn cam lại vàng”, thì hoa mơ ở đây là loại mơ gì, mọc tự nhiên hay do người trồng, có giá trị kinh tế không, mật ong hoa mơ ở đây có khác với mật ong hoa chôm chôm, mật ong hoa tràm không; nếu có giá trị kinh tế thì di dời loại mơ này đến địa phương nào?… Cam ở vùng đất này trồng cả vườn, như vậy giá trị kinh tế của nó có hơn các loại cam sành, cam giấy ở miền Nam, cam canh của Hà Nội không? Nếu hơn thì nên nhân rộng ra và di dời đến vùng đất nào tốt nhất?, v.v và v.v.

Cần phải có tự tin

Khi xe con tôi dừng lại trước khoảnh đất rộng như công viên, cỏ được cắt xén bằng tăm tắp, tôi thấy có cây trụ cao hơn cột cờ ở ta, và có mô hình nhiều người tuổi trẻ mặt mày tươi rói, nhởn nhơ đi trên ấy như đi dạo phố, không bị sức hút của trái đất. Con tôi cho biết đó là biểu tượng của CMU và chỗ ở của con tôi chỉ cần vài khúc quẹo là tới.

Nhìn biểu tượng này, tôi thấy như được nhìn vào cánh cửa lớn, trời đất bao la, song chỉ biết thở dài bởi quỹ thời gian và sức khỏe của lứa tuổi chúng tôi không thể bước vào đó. Nhìn những “người tuổi trẻ” ấy, tôi nghĩ cái gì là thiên tài? Đây chính là thiên tài! Cái gì là thiên phú? Đây chính là thiên phú! Dĩ nhiên, thiên phú chỉ là một mặt, dựa vào thiên phú không tồn tại đến cuối cùng, then chốt vẫn là ai có quyết tâm hơn, có nỗ lực hơn.

-Tác giả Vu Gia và ông Frank Longaker

Tác giả Vu Gia và ông Frank Longaker

Thấy sự thẫn thờ của tôi, con tôi cho biết học bên này rất căng thẳng, nhiều đêm phải 2g sáng nó mới về nhà. Làm nghiên cứu sinh ở Mỹ theo diện học bổng toàn phần, sau năm đầu không đạt đủ 4 điểm A là nhà trường báo cho quỹ học bổng biết nghiên cứu sinh không đủ khả năng “đi trọn đường tình”. Vậy là nghiên cứu sinh phải về nước. Nhiều người ở lại bưng bê kiếm sống, nộp hồ sơ xin học bổng tiếp, bởi theo họ, không có gì xấu hổ hơn phải về lại quê nhà vì bị nhà trường đuổi do học kém. Sĩ diện làm khổ người!

Tôi cười vui nói với con, thua không sợ, sợ nhất là đời này ngay cả chút dũng khí cũng không có. Suy nghĩ một lúc, con tôi cũng nhận ra điều đó và cho rằng không có áp lực thì… thiếu vui, thậm chí là vô nghĩa! Trong hồ có một con cá thì nó mãi mãi không hề biết áp lực. Nếu trong hồ có nhiều cá thì nó mới mạnh mẽ hơn được.

Nghe con nói như thế, tôi thấy ấm áp trong lòng, vì với tôi, con cái nghĩ được như vậy là đã thực sự trưởng thành. Đúng thôi! Tới tuổi lập thân rồi, đâu còn nhỏ nữa, đường đi là do mình chọn. Lúc này, cha mẹ chỉ biết nhìn theo và động viên con chứ quản cái gì. Ai cũng nói: “Con hơn cha là nhà có phúc”, nhưng bắt con theo mình thì mãi mãi chỉ là cái bóng của mình chứ làm sao vượt lên được. Muốn đánh vỡ thường quy, muốn đột phá lĩnh vực nào đó,… cần phải có tự tin, phải có chút ngạo khí, nếu không thì hãy quên đi, đừng nói gì đến mình chiến thắng mình. Chỉ có ý chí cầu tiến mạnh mẽ mới làm nên sự khác biệt.

Máy cũng biết tự học

Thời gian đi qua, chuyện “học máy” hay “máy học” đối với tôi chẳng có ý nghĩa gì. Thế nhưng, tại Hội thảo “100 năm chữ Quốc ngữ” do Hội Ngôn ngữ học TPHCM tổ chức vào cuối năm 2019, tôi như gặp lại… “người quen” qua tham luận “Chuyển tự tự động từ chữ Nôm sang chữ Quốc ngữ” của PGS-TS Đinh Điền cùng các cộng sự: Nguyễn Thị Kim Phượng, Diệp Gia Hân, Trần Nguyễn Sơn Thanh.

PGS-TS Đinh Điền cho biết đã “dạy” cho máy một số vốn chữ Nôm và máy đã chuyển chữ Nôm từ Truyện Kiều sang chữ Quốc ngữ, đạt hơn 78%. Machine Learning khác với con người ở chỗ “học” nhiều thì làm nhiều, “học” ít thì làm ít. Ông đã làm việc với Viện Hán Nôm, sắp tới máy sẽ được “học” thêm nhiều chữ Nôm hơn nữa (đưa thêm nhiều chữ Nôm vào kho ngữ liệu huấn luyện), thì máy sẽ càng “thông minh” hơn và cho kết quả chính xác hơn. Ngoài ra, máy cũng hơn nhiều người là có khả năng tự học để hoàn thiện tri thức bằng cách rút kinh nghiệm từ các lỗi dịch sai của máy sau khi con người hiệu đính lại những chỗ dịch sai đó. Quá trình này nếu được lặp lại càng nhiều thì máy sẽ cho ra những bản dịch tốt hơn về sau.

PGS-TS Đinh Điền trình bày tham luận tại hội thảo

PGS-TS Đinh Điền trình bày tham luận tại hội thảo

Cũng theo PGS-TS Đinh Điền, việc chuyển tự tự động từ chữ Nôm sang chữ Quốc ngữ là bài toán rất khó, vì chính con người chúng ta khi đọc chữ Nôm cũng phải “vừa đọc vừa đoán”, bởi cùng một chữ Nôm có thể được “dịch” (chuyển tự) sang nhiều chữ Quốc ngữ khác nhau. Ví dụ, chữ “trung” trong chữ Nôm, khi đọc thì có thể đọc là trung, đúng, trong, trúng, truồng,… tức là cùng một chữ Nôm nhưng có thể dịch thành nhiều hơn một chữ Quốc ngữ. Việc chọn chữ Quốc ngữ nào trong số các chữ Quốc ngữ khả dĩ nói trên của cùng một chữ Nôm là vấn đề khó không chỉ đối với máy mà còn đối với cả chính con người. Chẳng hạn, chữ “nghĩ/ nghỉ” trong câu Kiều: “Gia tư nghĩ/ nghỉ cũng thường thường bậc trung”. Với chữ Nôm này (nghĩ – suy nghĩ; nghỉ – ông ta, trong tiếng Việt cổ), giới học thuật đã tranh cãi hơn nửa thế kỷ qua với nhiều lập luận, chứng cứ lịch sử, văn học, phương ngữ,… mà đến nay vẫn chưa ngã ngũ, vì cả hai trường phái đều có cái lý của họ khi suy đoán chữ Nôm đó.

Vấn đề khó khăn đối với PGS-TS Đinh Điền và nhóm cộng sự là việc chọn chữ Quốc ngữ đúng trong số các chữ Quốc ngữ khả dĩ của chữ Nôm đó. Việc chọn lựa này phụ thuộc vào ngữ cảnh, thể loại, lĩnh vực và cả vào niên đại. Vì nguyên tắc của “học máy” là nếu chúng ta “dạy” cho máy ngữ liệu thuộc thể loại, lĩnh vực nào thì máy sẽ dịch tốt hơn với những văn bản thuộc thể loại hay lĩnh vực đó. Từ thực tế bước đầu này, PGS-TS Đinh Điền tin rằng một thời gian không xa, các kho tàng vô giá về lịch sử, địa lý, y học dân tộc, văn học,… được ông cha ta viết bằng chữ Nôm sẽ được thế hệ trẻ khai thác, khám phá bằng chính chữ Quốc ngữ của ngày hôm nay.

Tạo áp lực để cố gắng

Nghe qua tham luận này, tôi thấy mình cần phải quên tuổi đời xộc đến, nhất là muốn nói với lớp con cháu của tôi rằng một khi đã đến thời điểm nhất định, tầm mắt, suy nghĩ phải nhất định nâng lên. Ếch ngồi đáy giếng, chỉ nhìn thấy cảnh vật chung quanh, muốn có tiền đồ là điều không tưởng. Machine Learning còn biết tự học để hoàn thiện tri thức, để trở nên thông minh hơn, huống gì con người đang sống giữa cõi đời này. Đôi lúc cần phải tự hỏi tại sao người ta làm được mà mình không làm được? Phải tự tạo lấy áp lực mà cố gắng. Đời người có dài lắm đâu, nếu bỏ đi thời niên thiếu vô tư vô lự và thời tuổi tác đè nặng buộc nay ốm mai đau, thì thời gian “thực sống” có là bao. Con người, nếu đợi người khác thúc giục thì đã rớt lại phía sau, chỉ có bản thân tự tạo áp lực cho bản thân mới có thể đạt tới tầm cao nhất định. Dĩ nhiên, có một số việc, nhìn người khác làm luôn thấy rất dễ, giống như những nghệ sĩ xiếc chơi với lửa hứng khởi bừng bừng, song nếu mình không có bản lĩnh mà tùy tiện nhảy vào chẳng khác nào tình nguyện để lửa thiêu sống. Nhưng không thể kiên định lựa chọn của mình, thì đi tới đâu cũng không được hoan nghênh, bởi vì không ai tin, vĩnh viễn không thể nào được người ta lựa chọn làm hạch tâm, tùy thời có thể bị loại đầu tiên. Phong thủy luân chuyển, ai cũng không có thể vĩnh viễn bất bại. Nếu biết nhìn ra vì sao mà thất bại để tránh và tiếp tục tiến lên mới là điều đáng quý.

Gặp một số nghiên cứu sinh Việt Nam ở một số trường ĐH bên Mỹ đã và đang tiếp cận những tiến bộ của khoa học – công nghệ, tôi càng tin hơn vào tiền đồ đất nước, và bài học từ thuở thiếu thời bùng dậy trong tôi: “Đường đi không khó vì ngăn sông cách núi, mà khó vì lòng người ngại núi e sông” (Nguyễn Bá Học). Trên đời này, có cái gì thập toàn thập mỹ chờ mình đến nhặt đâu. Vì thế, tuyệt vọng là kẻ địch lớn nhất của con người, nếu không thể chiến thắng tuyệt vọng, ý chí sẽ suy kiệt, sẽ cam chịu những cảm xúc xấu nhất của mình./

-Tác giả Vu Gia và Ban lãnh đạo ANU

-Tác giả Vu Gia và Ban lãnh đạo ANU

 

 

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây