Update:
Sau khi train qua 4000 episodes, với batch_size = 50 (nó kiểu như cho Agent đi học 4 nghìn ngày, mỗi ngày học 50 ca, trên biểu đồ H1, của vàng), thì tôi mở tensorboard lên xem tình hình con Agent học hành thế nào rồi.
Bất ngờ hơn sự mong đợi của tôi. Kết quả này cho thấy một điề vô cùng quan trọng với tôi, rằng liệu cách làm nay có hiệu quả và có hi vọng hay không.
Biểu đồ thứ 2 từ trái qua, là giá trị profit trung bình. Đường line đó thể hiện nó có tạo ra lợi nhuận tịnh tiến theo thời gian học tập.
Biểu đồ số 1 và số 3, cho thấy con Agent vẫn đang trong quá trình học tập non nớt. Rất nhiều sai sót, rất nhiều lỗi lầm còn phải lấy kinh nghiệm.
Cách nay hơn 3 năm, thằng cháu tôi cũng nói như bạn vậy, AI dễ lắm, chú học AI đi. Từ đó đến nay vẫn lu bu chuyện cơm áo gạo tiền chưa rảnh để học. Bạn may mắn hơn tôi nhiều.
Chúc bạn mau tới đích như ý nhé
Biểu đồ cuối cùng cho thấy, con Agent vẫn đang trong giai đoạn dò đường (exploration). Nó liên tục gia tăng số lệnh trong mỗi phiên huấn luyện để tăng khả năng khám phá. Khi nào cái đường này bắt đầu đi ngang ngang một chút, thì lúc đó xét tiếp. Đây mới đang là giai đoạn R&D mà thôi. Tôi chưa expect gì nhiều bây giờ, còn phải làm nhiều việc nữa cơ.
Nói chung quá trình training thì nó không khác gì dạy học cả. Bạn dạy một người học một vấn đề nào đó, cũng giống như dạy cho cái máy vậy thôi. Ngôn ngữ dạy có thể khác nhau, nhưng phương pháp dạy và cách theo dõi, điều chỉnh chất lượng thì vẫn thế.
Điều này có nghĩa là, trong thời đại của AI, bạn không cần biết code để làm AI. Phần này dễ lắm, rồi sẽ có luôn hết các API, các Frameworks, cà Libraries hỗ trợ cho bạn từ A-Z. Bạn sẽ chỉ mất một ngày để có tất cả. Cái cuối cùng và quan trọng nhất, vẫn là giáo trình của bạn. Bạn hiểu một vấn đề như thế nào, và bạn định dạy cho một ai đó về vấn đề đó, hoàn toàn không có liên quan gì tới máy tính cả.
Hi vọng những phần cập nhật của tôi có thể tạo cảm hứng cho các bạn tìm hiểu về AI. Theo góc nhìn cá nhân của tôi, trong vòng nửa thập kỷ tới, AI sẽ tràn ngập vào cuộc sống ở mọi lĩnh vực, ngành nghề, quy mô. Chúng ta đang sống trong thời đại mà AI sẽ là một công cụ phổ thông như một cái tivi. Khi bạn không có, không biết, không làm AI, thì ở thời đại mới đấy, bạn giống như không có một chiếc tivi vậy. Hãy vọc AI đi nhé, vì nó không khó đâu. Và nó không phải là chuyên môn công nghệ đâu, nó là cuộc sống đấy.