1. Giới thiệu
AI tạo sinh đang làm biến đổi thế giới, thay đổi cách tạo ra hình ảnh, video, âm thanh, văn bản và mã (code). Mô hình ngôn ngữ lớn là một loại AI tạo sinh tập trung vào văn bản và mã thay vì hình ảnh hoặc âm thanh, một số đã bắt đầu tích hợp các phương thức khác nhau. Mô hình ngôn ngữ lớn là một trong những công nghệ mới phát triển nhanh nhất trong lịch sử, thu hút được sự quan tâm của cả giới học thuật và công nghệ. Mô hình ngôn ngữ lớn sở hữu khả năng giải quyết các nhiệm vụ đa dạng, trái ngược với các mô hình trước đó chỉ giới hạn trong việc giải quyết những nhiệm vụ cụ thể. Do hiệu suất cao trong việc xử lí các ứng dụng khác nhau như tác vụ ngôn ngữ tự nhiên nói chung và tác vụ theo miền cụ thể, mô hình ngôn ngữ lớn ngày càng được sử dụng bởi những cá nhân có nhu cầu thông tin quan trọng.
Nổi bật trong mô hình ngôn ngữ lớn là các mô hình GPT (Generative Pretraining Transformer) của AI được ứng dụng bước đầu trên kho dữ liệu khổng lồ nhằm tạo ngôn ngữ phù hợp theo ngữ cảnh và mạch lạc về mặt ngữ nghĩa. Theo Brown và cộng sự (2020), GPT-3 với 175 tỉ tham số, lớn hơn GPT-1 hơn 100 lần và lớn hơn GPT-2 hơn 10 lần đã hiển thị kết quả ấn tượng trong nhiều nhiệm vụ xử lí ngôn ngữ tự nhiên và có khả năng tạo ra văn bản không khác gì con người. Theo Bubeck và cộng sự (2023), GPT-4 với khoảng 10 nghìn tỉ tham số cho phép hoạt động tốt hơn trên nhiều tác vụ khác nhau trong xử lí các ngôn ngữ tự nhiên với độ chính xác, tin cậy cao hơn.
Ứng dụng của mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng là một trong những điểm sáng nổi bật. Với khả năng xử lí lượng lớn dữ liệu và hiểu biết sâu sắc về ngôn ngữ, mô hình ngôn ngữ lớn có thể cung cấp các giải pháp thông minh, tiên tiến giải quyết những thách thức phức tạp trong lĩnh vực tài chính - ngân hàng. Trong phân tích dữ liệu tài chính, mô hình ngôn ngữ lớn có thể được sử dụng để dự đoán xu hướng thị trường, đánh giá rủi ro đầu tư và phân tích các yếu tố ảnh hưởng đến giá cả. Bằng cách học từ dữ liệu lịch sử và cập nhật thông tin mới, mô hình có thể cung cấp những dự đoán chính xác, đáng tin cậy về các biến động tài chính. Trong lĩnh vực tư vấn tài chính và quản lí tài sản, mô hình ngôn ngữ lớn có thể được sử dụng để tạo ra các lời khuyên cá nhân hóa dựa trên tình hình tài chính của mỗi khách hàng. Bằng cách phân tích dữ liệu cá nhân và hiểu biết về mục tiêu, nhu cầu tài chính, mô hình có thể đề xuất các kế hoạch đầu tư, quản lí tài sản phù hợp. Ngoài ra, trong lĩnh vực giao dịch, dịch vụ khách hàng, mô hình ngôn ngữ lớn có thể được sử dụng để tạo ra các ứng dụng Chatbot thông minh và tự động hóa quy trình. Từ việc trả lời câu hỏi về sản phẩm và dịch vụ cho đến việc xử lí yêu cầu, phản hồi phản ánh, các hệ thống này có thể cung cấp dịch vụ khách hàng chất lượng cao, hiệu quả.
Tuy nhiên, việc áp dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng cũng đặt ra một số thách thức. Đặc biệt là vấn đề về bảo mật dữ liệu và đạo đức trong việc sử dụng thông tin cá nhân của khách hàng. Để giải quyết các thách thức này, các tổ chức cần thiết lập biện pháp bảo mật chặt chẽ; tuân thủ các quy định liên quan. Tuy nhiên, với sự tiến bộ không ngừng của công nghệ và nỗ lực của cộng đồng, mô hình ngôn ngữ lớn có tiềm năng lớn, cung cấp những giải pháp đổi mới và giá trị cho lĩnh vực tài chính - ngân hàng trong tương lai.
2. Mô hình ngôn ngữ lớn
2.1. Khái niệm
AI đang phát triển mạnh mẽ và ứng dụng trong mọi lĩnh vực dựa trên sự phát triển các mô hình học máy (Machine Learning - ML), học sâu (Deep Learning - DL) được huấn luyện trên các tập dữ liệu lớn. ML là một tập hợp con của AI, tập trung vào các thuật toán và mô hình cho phép máy học từ dữ liệu. DL là một trường con của ML sử dụng mạng thần kinh nhân tạo với nhiều lớp để tìm hiểu các mẫu phức tạp trong dữ liệu. Các mô hình ngôn ngữ lớn là một tập hợp con của DL, tập trung vào các mô hình xử lí ngôn ngữ tự nhiên và được đào tạo dựa trên nguồn dữ liệu lớn về văn bản.
Theo Zhou và cộng sự (2023), mô hình ngôn ngữ lớn là các mô hình xử lí ngôn ngữ tự nhiên (Natural Language Processing - NLP) được đào tạo dựa trên lượng dữ liệu văn bản khổng lồ, có thể tạo ra các phản hồi mạch lạc và phù hợp với ngữ cảnh. Theo Vaswani và cộng sự (2017), mô hình ngôn ngữ lớn được xây dựng bằng cách sử dụng các kiến trúc DL và đã chứng tỏ được trình độ vượt trội trong việc hiểu, tạo ra văn bản giống con người. Mô hình ngôn ngữ lớn bao gồm các mô hình ngôn ngữ mở rộng và linh hoạt, ban đầu được đào tạo về dữ liệu văn bản mở rộng để nắm bắt các khía cạnh cơ bản của ngôn ngữ, sau đó, được tinh chỉnh cho các ứng dụng hoặc tác vụ cụ thể, cho phép điều chỉnh, tối ưu hóa các mục đích cụ thể. Mô hình ngôn ngữ lớn đã mở ra một kỉ nguyên mới trong xử lí ngôn ngữ tự nhiên và liên tục được khám phá về tiềm năng.
2.2. Cơ sở
Mô hình ngôn ngữ lớn dựa trên các cơ sở vững chắc về AI, xử lí ngôn ngữ tự nhiên, cùng với các kĩ thuật, công nghệ tiên tiến để xử lí dữ liệu lớn và tối ưu hóa tính toán. Các cơ sở này giúp mô hình có khả năng học và hiểu ngôn ngữ như con người một cách hiệu quả, chính xác. Một số cơ sở của mô hình ngôn ngữ lớn bao gồm:
Hochreiter và Schmidhuber (1997) giới thiệu mạng trí nhớ ngắn hạn, định hướng dài hạn (Long short term memory - LSTM) - là một kiến trúc đặc biệt của mạng thần kinh hồi quy (Recurrent neural network - RNN), có khả năng học được phụ thuộc trong dài hạn (Long-term dependencies). LSTM khắc phục được rất nhiều những hạn chế của RNN trước đây về triệt tiêu đạo hàm, nhưng có cấu trúc phức tạp hơn. LSTM là một loại mạng nơ-ron có khả năng xử lí dữ liệu chuỗi như văn bản một cách hiệu quả, giúp mô hình học được cấu trúc và tạo mối quan hệ trong dữ liệu ngôn ngữ một cách linh hoạt, có khả năng ghi nhớ thông tin từ quá khứ trong quá trình dự đoán tương lai.
Theo Waswani và cộng sự (2017), kiến trúc Transformer được giới thiệu bởi một nghiên cứu của Google vào năm 2017 đã đem lại những cải tiến đáng kể trong việc xử lí ngôn ngữ tự nhiên. Kiến trúc này giúp mô hình có khả năng học được mối quan hệ không gian và thời gian trong văn bản một cách hiệu quả hơn so với những phương pháp truyền thống. Cơ sở của mô hình ngôn ngữ lớn dựa trên Transformer, có nhiều lớp biến áp, được đào tạo trước về văn bản và tinh chỉnh để trò chuyện. Quá trình đào tạo trước sử dụng kho dữ liệu văn bản khổng lồ để tìm hiểu những từ nào thường được dùng theo sau các từ khác, sau đó, được tinh chỉnh cho các tác vụ cụ thể như tóm tắt văn bản, tạo ngôn ngữ hoặc trả lời câu hỏi.
Học tăng cường (Reinforcement Learning): Một số mô hình ngôn ngữ lớn sử dụng kĩ thuật học tăng cường để cải thiện hiệu suất và độ chính xác. Quá trình học tăng cường cho phép mô hình tương tác với môi trường, nhận phản hồi để cải thiện dự đoán và quyết định.
Tinh chỉnh tính toán (Computational Efficiency): Một trong những thách thức lớn nhất của mô hình ngôn ngữ lớn là tinh chỉnh tính toán để giảm thiểu thời gian huấn luyện và chi phí tính toán. Các phương pháp như tự động song song và tối ưu hóa phần cứng giúp tăng tốc quá trình huấn luyện và triển khai.
Xử lí dữ liệu lớn (Big Data Processing): Mô hình ngôn ngữ lớn thường được huấn luyện trên lượng lớn dữ liệu ngôn ngữ từ các nguồn khác nhau trên Internet. Do đó, việc xử lí dữ liệu lớn và phân phối tính toán trở thành yếu tố quan trọng trong việc xây dựng, triển khai mô hình.
2.3. Nền tảng thúc đẩy các mô hình ngôn ngữ lớn phát triển
Mô hình ngôn ngữ lớn là một lĩnh vực nghiên cứu đang ngày càng phát triển nhanh chóng. Các mô hình ngôn ngữ lớn thường được đào tạo trên dữ liệu lớn và có khả năng tự học để hiểu và tạo ra ngôn ngữ tự nhiên. Một số nền tảng thúc đẩy các mô hình ngôn ngữ lớn phát triển mạnh mẽ và trở thành xu hướng công nghệ nổi bật trong thời gian tới gồm có:
Thứ nhất, sự bùng nổ của dữ liệu lớn: Sự phát triển của mô hình ngôn ngữ lớn yêu cầu một lượng lớn dữ liệu đa dạng để đào tạo. Các nền tảng thường cung cấp khả năng truy cập và quản lí dữ liệu lớn, bao gồm cả văn bản, hình ảnh, âm thanh và video từ nhiều nguồn khác nhau, cung cấp nguồn dữ liệu đầu vào cho các mô hình ngôn ngữ lớn. Theo Công ty Dữ liệu quốc tế (IDC), lượng dữ liệu toàn cầu được tạo ra và sao lưu dự kiến sẽ tăng từ khoảng 59 zettabytes vào năm 2020 lên đến hơn 149 zettabytes vào năm 2025. Dòng chảy liên tục của các bộ dữ liệu đa dạng và phong phú góp phần vào việc huấn luyện các mô hình ngôn ngữ lớn phức tạp hơn, trao quyền cho mô hình ngôn ngữ lớn điều chỉnh, nâng cao khả năng hiểu các sắc thái và bối cảnh ngôn ngữ tối ưu hơn.
Thứ hai, sức mạnh tính toán của công nghệ đã phát triển mạnh mẽ: Đào tạo và triển khai các mô hình ngôn ngữ lớn đòi hỏi tài nguyên tính toán lớn. Các nền tảng cung cấp giải pháp tính toán đám mây, đồng thời cung cấp các phương tiện để quản lí và tối ưu hóa việc sử dụng tài nguyên. Các nền tảng điện toán đám mây đã cung cấp quyền truy cập không giới hạn vào tài nguyên điện toán hiệu suất cao. Ngoài ra, sự phát triển của công nghệ đã có nhiều cải tiến trong các bộ xử lí (CPU, GPU, TPU...) của máy trạm, máy chủ... kết hợp với năng lực phát triển của điện toán phân tán, điện toán song song đã tạo điều kiện cho việc đào tạo các mô hình ngôn ngữ lớn với hàng tỉ tham số trở nên khả thi. Ngoài ra, còn có sự phát triển mạnh mẽ của các công cụ thư viện hỗ trợ mô hình ngôn ngữ lớn như TensorFlow, PyTorch và Hugging Face Transformers cung cấp các giao diện, chức năng thuận tiện để xây dựng, đào tạo, triển khai mô hình ngôn ngữ lớn. Nền tảng công nghệ đã làm gia tăng mạnh mẽ sức mạnh tính toán, là cơ sở quan trọng để mô hình ngôn ngữ lớn có sự phát triển, đổi mới và được ứng dụng rộng rãi hơn.
Thứ ba, cộng đồng nghiên cứu, phát triển mô hình ngôn ngữ lớn mạnh mẽ và bùng nổ: Sự hỗ trợ từ cộng đồng nghiên cứu và phát triển là yếu tố chính để nền tảng phát triển. Những tiến bộ trong thuật toán ML, DL đặc biệt là trong xử lí ngôn ngữ tự nhiên và kiến trúc mạng nơ-ron đóng góp rất quan trọng trong việc xác định khả năng của các mô hình ngôn ngữ lớn. Các dự án mã nguồn mở và việc chia sẻ kiến thức giữa cộng đồng làm tăng khả năng sáng tạo và giải quyết các thách thức. Các tổ chức, công ty liên tục đầu tư vào nghiên cứu, đổi mới để cải thiện hiệu suất và tính ứng dụng của mô hình ngôn ngữ lớn. Các công ty công nghệ lớn như OpenAI, Google, Facebook, Microsoft và IBM đã tiến hành đầu tư đáng kể vào nghiên cứu, phát triển mô hình ngôn ngữ lớn.
2.4. Xu hướng phát triển của mô hình ngôn ngữ lớn
Theo các hãng nghiên cứu và phân tích thị trường, quy mô thị trường mô hình ngôn ngữ lớn toàn cầu được dự đoán sẽ có mức tăng trưởng bùng nổ trong những năm tới. Theo hãng nghiên cứu thị trường GrandViewResearch (2023), quy mô thị trường mô hình ngôn ngữ lớn toàn cầu đạt 4,35 tỉ USD vào năm 2023 và dự kiến sẽ tăng trưởng với tốc độ tăng trưởng kép hằng năm (CAGR) là 35,9% từ năm 2024 đến năm 2030. Việc tích hợp tính năng không can thiệp của con người vào các hệ thống đào tạo là một động lực đằng sau sự tăng tốc của thị trường mô hình ngôn ngữ lớn. Khả năng này tăng hiệu quả bằng cách cho phép các mô hình tự học và thích ứng mà không cần giám sát thủ công liên tục, giảm đáng kể nhu cầu về thời gian và tài nguyên.
Các nhà cung cấp mô hình ngôn ngữ lớn hàng đầu thế giới bao gồm các BigTech như Alibaba, Amazon.com Inc, Baidu, Google, Huawei, Meta, Microsoft, OpenAI, Tencent, Yandex... tập trung vào các mảng thị trường bán lẻ, thương mại điện tử, truyền thông xã hội và giải trí trên nền tảng số.
3. Ứng dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng
Sự tiến bộ trong mô hình ngôn ngữ lớn đã mở ra nhiều cơ hội ứng dụng trong lĩnh vực tài chính - ngân hàng. Những ứng dụng này không chỉ giúp tăng cường hiệu suất, chất lượng trong lĩnh vực tài chính - ngân hàng mà còn mở ra cơ hội mới cho sự sáng tạo, cải tiến trong quá trình quản lí tài chính và dịch vụ ngân hàng.
Thứ nhất, tối ưu hóa trải nghiệm khách hàng. Mô hình ngôn ngữ lớn tạo điều kiện thuận lợi để đề xuất những sản phẩm, dịch vụ của các tổ chức tài chính - ngân hàng được đưa vào đời sống thực tế và trải nghiệm sản phẩm, dịch vụ tài chính của khách hàng được cá nhân hóa thông qua phân tích sở thích, hành vi, lịch sử mua hàng của khách hàng, nâng cao sự hài lòng và thúc đẩy doanh thu sản phẩm, dịch vụ. Trong bối cảnh chuyển đổi số đang diễn ra mạnh mẽ hiện nay, mô hình ngôn ngữ lớn hỗ trợ các tổ chức tài chính - ngân hàng hiểu rõ hành vi, sở thích của người tiêu dùng kĩ thuật số, thích ứng với thị trường kĩ thuật số đang phát triển nhanh chóng, thúc đẩy các tính năng tìm kiếm và công cụ đề xuất nâng cao, cải thiện khả năng khám phá sản phẩm, dịch vụ tài chính - ngân hàng và cuối cùng dẫn đến chuyển đổi cao hơn và cải thiện khả năng giữ chân khách hàng. Mô hình ngôn ngữ lớn hỗ trợ đánh giá xu hướng thị trường, tiến hành phân tích hành vi khách hàng đối với sản phẩm, dịch vụ tài chính - ngân hàng. Điều này trao quyền cho các tổ chức tài chính - ngân hàng nâng cao chiến lược marketing, phát triển các chiến dịch tập trung và tối ưu hóa lộ trình tiếp cận, chuyển đổi khách hàng.
Thứ hai, hỗ trợ hoạt động quản trị rủi ro trong ngân hàng. Các mô hình mô hình ngôn ngữ lớn hỗ trợ ngân hàng phát hiện các rủi ro tài chính và gian lận, đồng thời đảm bảo an toàn thông tin khách hàng, từ đó, cải thiện tính bảo mật và độ tin cậy của dịch vụ tài chính. Với mô hình ngôn ngữ lớn hỗ trợ xác định những điểm bất thường có thể báo hiệu các hoạt động gian lận tiềm ẩn. Việc sử dụng một hệ thống dự báo rủi ro giao dịch giúp ngân hàng phòng ngừa, ngăn chặn gian lận ngay từ khi bắt đầu phát sinh giao dịch, giảm thiểu tối đa rủi ro cho ngân hàng. Ngoài ra, các mô hình ngôn ngữ lớn có thể phân tích thông tin từ nhiều nguồn để đánh giá rủi ro tín dụng của khách hàng và đưa ra quyết định về việc cấp tín dụng hay không. Mô hình ngôn ngữ lớn hỗ trợ hoạt động quản trị rủi ro trong ngân hàng bao gồm cả trong các hoạt động giao dịch đến các hoạt động quản trị và chiến lược bằng cách hỗ trợ đưa ra các dự báo/cảnh báo rủi ro theo thời gian thực.
Thứ ba, điều hướng các quy định và tuân thủ trong hoạt động ngân hàng. Với lượng dữ liệu lớn đã được ngân hàng dùng để áp dụng cho các mô hình ngôn ngữ lớn sẽ rút ra được nhiều quy luật, tri thức hỗ trợ cho ngân hàng trong việc điều hướng các quy định và tuân thủ trong hoạt động ngân hàng. Mô hình ngôn ngữ lớn không chỉ giúp ngân hàng nắm bắt, thích ứng nhanh chóng với các quy định, yêu cầu tuân thủ, mà còn giúp cải thiện hiệu suất và đảm bảo tính chính xác trong các quy trình liên quan đến tuân thủ, quản lí rủi ro. Mô hình ngôn ngữ lớn có thể được sử dụng để tự động hóa quy trình xử lí hợp đồng và văn bản pháp lí. Việc này giúp đảm bảo rằng, mọi thông tin liên quan đến hợp đồng và văn bản pháp lí đều được xử lí, theo dõi một cách chính xác, giảm rủi ro vi phạm quy định. Mô hình ngôn ngữ lớn có thể được sử dụng để phân tích dữ liệu, đảm bảo rằng quy trình làm việc tuân thủ các nguyên tắc và quy định. Việc này giúp ngân hàng đảm bảo mọi hoạt động đều được thực hiện một cách hiệu quả và đúng đắn. Mô hình ngôn ngữ lớn có thể được sử dụng để cung cấp tư vấn về tuân thủ và hướng dẫn về cách thực hiện các quy định. Việc này giúp đội ngũ nhân viên ngân hàng hiểu rõ các yêu cầu tuân thủ và hành động cần thực hiện để tuân thủ. Bên cạnh đó, mô hình ngôn ngữ lớn có thể giúp phân tích dữ liệu tài chính để đánh giá rủi ro và đề xuất các biện pháp cần thiết để tuân thủ với yêu cầu quy định. Việc này giúp ngân hàng duy trì sự ổn định và an toàn trong hoạt động tài chính. Mô hình ngôn ngữ lớn có thể được tích hợp vào hệ thống để theo dõi, đánh giá mức độ tuân thủ với các chuẩn bảo mật thông tin, giúp ngân hàng giữ cho dữ liệu khách hàng an toàn và tuân thủ các yêu cầu bảo mật. Ngoài ra, mô hình ngôn ngữ lớn có thể được sử dụng để theo dõi, dự đoán biến động trong luật pháp và quy định, giúp ngân hàng chuẩn bị trước và điều chỉnh các quy trình để tuân thủ với các thay đổi pháp lí.
4. Những thách thức của mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng
Mô hình ngôn ngữ lớn đã thâm nhập vào nhiều ngành khác nhau, trong đó có tài chính - ngân hàng, với hứa hẹn nâng cao dịch vụ khách hàng, tạo điều kiện thuận lợi cho nghiên cứu và cung cấp phân tích tài chính nâng cao, tối ưu hóa hoạt động của ngân hàng. Tuy nhiên, các mô hình ngôn ngữ lớn hiện tại vẫn gặp khó khăn, thách thức, để khắc phục cần phải có lượng dữ liệu lớn, mạnh mẽ, tài nguyên tính toán cao, giải quyết được các vấn đề về đạo đức và an ninh trong việc sử dụng mô hình để tạo ra nội dung tự động.
Thách thức thứ nhất là việc xây dựng và triển khai mô hình ngôn ngữ lớn đòi hỏi sự đầu tư lớn về cả dữ liệu và tài nguyên tính toán. Để huấn luyện một mô hình ngôn ngữ lớn có khả năng hiểu, biểu đạt ngôn ngữ tự nhiên một cách toàn diện, cần có một lượng lớn dữ liệu văn bản phong phú và đa dạng. Tuy nhiên, việc thu thập, chuẩn bị dữ liệu lớn đặt ra thách thức, đặc biệt là khi cần đảm bảo tính đa dạng và chất lượng của dữ liệu. Khi đã có dữ liệu, các mô hình ngôn ngữ lớn cần thực hiện triển khai, vận dụng. Quá trình vận dụng và triển khai mô hình ngôn ngữ lớn đòi hỏi tài nguyên tính toán lớn. Cụ thể, việc huấn luyện một mô hình ngôn ngữ lớn trên một lượng lớn dữ liệu cần sử dụng cụm máy tính với nhiều GPU (bộ xử lí đồ họa) hoặc TPU (bộ vi xử lí dành cho các tác vụ liên quan ML và AI) để đảm bảo thời gian hợp lí. Đồng thời, việc triển khai mô hình trên các ứng dụng thực tế cũng đòi hỏi tài nguyên tính toán đủ lớn để xử lí dữ liệu và tính toán các dự đoán một cách nhanh chóng, hiệu quả. Sử dụng tài nguyên tính toán lớn và việc thu thập dữ liệu có thể tốn kém chi phí đáng kể. Các tổ chức phải cân nhắc đến vấn đề chi phí để thu thập, lưu trữ và xử lí dữ liệu, cũng như chi phí sử dụng các dịch vụ máy tính đám mây hoặc phát triển, duy trì cơ sở hạ tầng tính toán riêng.
Thách thức thứ hai của mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng là vấn đề về đạo đức. Mô hình ngôn ngữ lớn có thể hấp thụ và tái tạo thiên lệch về một khuynh hướng từ dữ liệu tích lũy, dẫn đến kết quả không công bằng và phân biệt đối xử. Mô hình ngôn ngữ lớn có thể tạo ra các dự đoán hoặc gợi ý dựa trên dữ liệu tích lũy có thể đưa ra các kết quả không công bằng hoặc phân biệt đối xử trong việc cung cấp các dịch vụ tài chính hoặc ứng xử với khách hàng. Mô hình ngôn ngữ lớn cũng có thể dễ dàng tạo ra thông tin giả mạo về tài chính, bao gồm việc tạo ra thông tin về thị trường tài chính hoặc tài sản giả mạo, gây hại đến quyết định đầu tư và tài chính của người tiêu dùng. Sử dụng mô hình ngôn ngữ lớn để tạo ra các dự đoán hoặc tư vấn tài chính đòi hỏi sự cẩn trọng để đảm bảo tính chính xác, đạo đức của thông tin được cung cấp, đặc biệt là khi liên quan đến việc quản lí rủi ro tài chính và đầu tư. Việc sử dụng mô hình ngôn ngữ lớn để đưa ra quyết định tài chính tự động đặt ra câu hỏi về tính đạo đức, minh bạch của quyết định này, bao gồm việc đảm bảo rằng các quyết định không gây tổn hại đến quyền lợi và tài chính của người tiêu dùng.
Thách thức thứ ba của mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng là vấn đề an ninh và an toàn. Mô hình ngôn ngữ lớn thường cần được áp dụng trên dữ liệu tài chính nhạy cảm, bao gồm thông tin về giao dịch, tài khoản ngân hàng, thông tin cá nhân của khách hàng. Do đó, việc bảo vệ dữ liệu khỏi các mối đe dọa như truy cập trái phép và phá hoại là một thách thức lớn. Mô hình ngôn ngữ lớn có thể được sử dụng để phát hiện gian lận và xâm nhập vào hệ thống tài chính - ngân hàng. Tuy nhiên, cùng với đó là thách thức phải phân biệt giữa giao dịch hợp pháp và gian lận, đảm bảo rằng các biện pháp bảo mật không gây ra sự cản trở không cần thiết đối với người dùng hợp pháp. Ngoài ra, sử dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng đòi hỏi các tổ chức phải quản lí rủi ro một cách chặt chẽ, tuân thủ các quy định về an toàn và bảo mật, bao gồm các quy định về bảo vệ dữ liệu cá nhân và các tiêu chuẩn an ninh thông tin.
5. Kết luận và một số hàm ý
Sử dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng mang lại nhiều cơ hội và tiềm năng, nhưng đồng thời cũng đặt ra nhiều thách thức về đạo đức, an ninh. Để đảm bảo ứng dụng của mô hình ngôn ngữ lớn là tích cực, bền vững, các tổ chức cần thực hiện các biện pháp chặt chẽ để đảm bảo tính an toàn, đạo đức và tuân thủ quy định. Đây là cơ sở quan trọng để các tổ chức tài chính - ngân hàng định hướng nghiên cứu, phát triển mô hình ngôn ngữ lớn trong các hoạt động. Một số khuyến nghị đề xuất để ứng dụng mô hình ngôn ngữ lớn vào các hoạt động của lĩnh vực tài chính - ngân hàng bao gồm:
Thứ nhất, cần thiết lập các quy định và quy phạm pháp lí để kiểm soát việc sử dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng đảm bảo tính minh bạch, bảo mật và đạo đức của các hoạt động.
Thứ hai, cần tạo ra các tiêu chuẩn, quy trình hợp tác giữa các tổ chức, cơ quan quản lí và các chuyên gia trong lĩnh vực tài chính - ngân hàng để đảm bảo việc sử dụng mô hình ngôn ngữ lớn an toàn và hiệu quả.
Thứ ba, cần đào tạo, nâng cao năng lực cho các nhà quản lí, nhà nghiên cứu, nhân viên trong lĩnh vực tài chính - ngân hàng sử dụng mô hình ngôn ngữ lớn một cách đạo đức và an toàn.
Thứ tư, thiết lập các cơ chế kiểm soát, giám sát để đảm bảo rằng việc sử dụng mô hình ngôn ngữ lớn trong tài chính - ngân hàng tuân thủ các nguyên tắc, quy định đạo đức và an ninh.
Thứ năm, cần đầu tư nghiên cứu, phát triển các phương pháp, công nghệ mới để giải quyết các thách thức đạo đức và an ninh liên quan đến việc sử dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng.
Thứ sáu, cần tạo ra môi trường khuyến khích, hỗ trợ việc sử dụng mô hình ngôn ngữ lớn trong lĩnh vực tài chính - ngân hàng một cách tích cực, sáng tạo; đồng thời đảm bảo rằng các hoạt động này không gây ra tổn hại cho khách hàng và cộng đồng.
Tài liệu tham khảo:
1. Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., ... & Amodei, D. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.
2. Bubeck, S., Chandrasekaran, V., Eldan, R., Gehrke, J., Horvitz, E., Kamar, E. & Zhang, Y. (2023). Sparks of artificial general intelligence: Early experiments with gpt-4. arXiv preprint arXiv:2303.12712.
3. Carlini, N., Tramer, F., Wallace, E., Jagielski, M., Herbert-Voss, A., Lee, K. & Raffel, C. (2021). Extracting training data from large language models. In 30th USENIX Security Symposium (USENIX Security 21), pages 2633-2650.
4. GrandViewResearch (2023). Large Language Model Market Trends. https://www.grandviewresearch.com/industry-analysis/large-language-model-llm-market-report, truy cập ngày 25/02/2024.
5. Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), pages 1735-1780.
6. India AI (2023). The Future of Large Language Models (LLMs): Strategy, Opportunities and Challenges. https://indiaai.gov.in/article/the-future-of-large-language-models-llms-strategy-opportunities-and-challenges, truy cập ngày 20/02/2024.
7. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N. & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
8. Waswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. & Polosukhin, I. (2017, December). Attention is all you need. In NIPS.
9. Zhou, C., Li, Q., Li, C., Yu, J., Liu, Y., Wang, G. & Sun, L. (2023). A comprehensive survey on pretrained foundation models: A history from bert to chatgpt. arXiv preprint arXiv:2302.09419.
TS. Nguyễn Văn Thủy