“xử lý tiếng Việt” gặp khó

Đề án “Sớm đưa Việt Nam trở thành nước mạnh về CNTT-TT” được Thủ tướng Chính phủ phê duyệt từ tháng 9/2010 đã ghi nhận tầm quan trọng của việc “xử lý tiếng Việt”, song đến giờ vẫn chưa có được những động thái cần thiết để cụ thể hóa công việc này.

“xử lý tiếng Việt” gặp khó

Đề án “Sớm đưa Việt Nam trở thành nước mạnh về CNTT-TT” được Thủ tướng Chính phủ phê duyệt từ tháng 9/2010 đã ghi nhận tầm quan trọng của việc “xử lý tiếng Việt”, song đến giờ vẫn chưa có được những động thái cần thiết để cụ thể hóa công việc này.


Khái niệm “xử lý tiếng Việt” được hiểu là nhiệm vụ giải quyết các bài toán về ngôn ngữ học trong môi trường CNTT nhằm phục vụ công tác lưu trữ, tìm kiếm, chuẩn hoá dữ liệu, nhận dạng văn bản, tiếng nói, dịch tự động, ngoại giao số..., trong đó có cả những “bài toán” về ngôn ngữ của cộng đồng các dân tộc thiểu số.

“xử lý tiếng Việt” gặp khó

Những công việc chính của “xử lý tiếng Việt” gồm: chuẩn hoá về mã, quy phạm chính tả; xây dựng từ điển thuật ngữ CNTT; xây dựng các công cụ tìm kiếm cho tiếng Việt; xây dựng các công cụ nhận dạng chữ in, chữ viết, tiếng nói của tiếng Việt; xây dựng công cụ kiểm lỗi chính tả, ngữ pháp tiếng Việt; xây dựng các công cụ phân tích ngữ nghĩa của tiếng Việt nhằm mục đích để máy tính hiểu tiếng Việt; xây dựng các công cụ tóm tắt nội dung các văn bản có dung lượng lớn của tiếng Việt.

Tuy nhiên, trên thực tế, cụ thể hóa nhiệm vụ “xử lý tiếng Việt” không đơn giản. Chỉ riêng việc xây dựng, thống nhất được chuẩn chính tả tiếng Việt trên môi trường máy tính cũng là chuyện rất phức tạp. Từ ngày máy vi tính xuất hiện ở Việt Nam tới nay (hơn 20 năm), các Bộ, ngành hữu quan vẫn chưa thể xúc tiến được việc này.

Ông Nguyễn Đức Hoàng, Chánh Văn phòng kiêm Trưởng Ban TT-TT Hội Trí thức Khoa học – Công nghệ Trẻ Việt Nam (VAYSE) dẫn chứng chuyện các Bộ, ngành đều có kho thuật ngữ chuyên ngành của riêng mình nên khi kết nối số hóa liên ngành sẽ nảy sinh nhiều bất cập. Chẳng hạn trong ngành CNTT, khái niệm “account” có nghĩa là tài khoản truy cập, nhưng trong ngành Tài chính thì “account” lại là tài khoản gửi tiền.

“Xử lý tiếng Việt” không còn là câu chuyện của riêng ngành CNTT hay ngành Ngôn ngữ học mà đã trở thành vẫn đề mang tính liên ngành, đòi hỏi phải có sự nhất trí cao của tất cả các lĩnh vực liên quan.

Ngày 30/11, tại Tọa đàm với chủ đề “Xử lý tiếng Việt – nhiệm vụ quan trọng của Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT-TT” diễn ra ở Liên hiệp các Hội Khoa học & Kỹ thuật Việt Nam (VUSTA), VAYSE và Hội Ngôn ngữ học Việt Nam (VLS) đã kiến nghị VUSTA sớm đề nghị Chính phủ và các Bộ, ngành hữu quan chủ trì việc cụ thể hóa các nội dung cho nhiệm vụ “xử lý tiếng Việt”. Theo đó, cần phải thành lập một Hội đồng khoa học với sự tham gia của các chuyên gia trong các lĩnh vực CNTT, Ngôn ngữ học, Dịch thuật…, và cử ra 1 chuyên gia uy tín để chủ trì chỉ đạo triển khai.

Mặt khác, VUSTA cần nghiên cứu đề xuất với Quốc hội, Chính phủ và các Bộ, ngành hữu quan về việc xây dựng Luật Ngôn ngữ và thành lập Hội đồng Quốc gia về ngôn ngữ trực thuộc Thủ tướng Chính phủ. Hội đồng này sẽ là đầu mối của Chính phủ chỉ đạo, giám sát việc thực thi nhiệm vụ “xử lý tiếng Việt” của Đề án “Sớm đưa Việt Nam trở thành nước mạnh về CNTT-TT”.

Hà Minh

loading...
Loading...
Tin cùng chuyên mục
CÓ THỂ BẠN QUAN TÂM

Đọc nhiều