Chương 7: Phân chia lại lao động
Con người và máy móc đều có sai sót. Khi chưa biết rõ, chúng ta không thể nhận định con người và máy móc nên kết hợp như thế nào để tạo ra dự đoán. Tại sao ư? Đó là dựa trên một khái niệm của Adam Smith từ thế kỷ 18 về sự phân chia lao động, gán vai trò cho từng cá nhân dựa trên điểm mạnh của họ. Trong trường hợp này là sự phân chia lao động giữa con người và máy móc để làm ra dự đoán. Để phân chia tốt nhất thì chúng ta phải xác định khía cạnh nào trong dự đoán do bên nào đảm nhiệm là tốt nhất và từ đó xác định vai trò đặc trưng riêng của từng bên.
Có một thí nghiệm tâm lý thuở xưa trong đó đối tượng nhận được một chuỗi X và O và được yêu cầu dự đoán đơn vị tiếp theo. Ví dụ, chuỗi họ nhận được có thể là:
O X X O X O X O X O X X O O X X O X O X X X O X X
Đối với một chuỗi như thế, đa số người ta nhận thấy có nhiều X hơn O, hay chính xác hơn là có 60% là X và 40% là O, nên họ đoán là X sẽ xuất hiện phần lớn, thỉnh thoảng chen O vào để cân bằng lại. Tuy nhiên, nếu muốn tối đa hóa cơ hội dự đoán đúng, bạn sẽ luôn chọn X. Như vậy bạn sẽ đúng trong 60% lần chọn. Nếu bạn chọn ngẫu nhiên 60/40, theo suy nghĩ của đa số người tham gia thí nghiệm, kết quả dự đoán của bạn đúng trong 52% lần chọn, chỉ cao hơn một chút so với việc bạn không cần cân nhắc số lần xuất hiện của X hay O gì hết mà cứ đoán bừa cái nào cũng được (50/50).
Thí nghiệm như thế cho thấy con người chúng ta có kỹ năng thống kê kém, ngay cả trong những tình huống chúng ta có thể phân tích xác suất ổn. Cỗ máy dự đoán sẽ không bao giờ phạm một sai lầm như vậy. Có thể là do con người không xem trọng nhiệm vụ này, họ cảm thấy mình như đang tham gia một trò chơi. Liệu họ có phạm sai lầm tương tự nếu như hậu quả của việc chọn lựa này không phải là trong một trò chơi?
Câu trả lời một cách chắc chắn là có, như đã được chứng minh qua nhiều thí nghiệm của nhà tâm lý học Daniel Kahneman và Amos Tversky. Khi họ yêu cầu người tham gia cân nhắc 2 bệnh viện – một nơi có 45 ca sinh mỗi ngày, một nơi có 15 ca sinh mỗi ngày – và hỏi họ là bệnh viện nào có số ngày có tỉ lệ ca sinh là con trai từ 60% trở lên nhiều hơn, rất ít người đưa ra đáp án đúng là bệnh viện nhỏ. Bệnh viện nhỏ là câu trả lời đúng vì khi số lượng mẫu càng lớn (trong trường hợp này là số ca sinh), tỉ lệ nam nữ mỗi ngày càng gần với tỉ lệ trung bình hơn (trong trường hợp này là 50%). Để hiểu kỹ hơn, hãy hình dung bạn đang tung đồng xu. Tỉ lệ bạn bắt được mặt hình sẽ cao hơn nếu bạn tung 5 lần so với khi bạn tung 50 lần. Do đó, bệnh viện nhỏ, chính là vì có ít số ca sinh hơn, mà có xác suất cao hơn nhận được kết quả lệch xa mức trung bình.
Đã có nhiều quyển sách viết về phỏng đoán và thành kiến tương tự. Nhiều người gặp khó khăn khi đưa ra dự đoán dựa trên các nguyên tắc thống kê hợp lý, cũng vì thế mà họ tìm đến các chuyên gia. Nhưng thật không may, các chuyên gia cũng chịu tác động của thành kiến và gặp khó khăn với thống kê khi đưa ra quyết định. Những thành kiến này nở rộ trong nhiều lĩnh vực khác nhau như y học, luật, thể thao, và kinh doanh. Tversky cùng với các nhà nghiên cứu tại Trường y Harvard đã đưa cho các bác sĩ hai phương pháp điều trị ung thư phổi: xạ trị hoặc phẫu thuật. Dựa trên tỉ lệ sống sót sau 5 năm thì đúng lý ra là nên phẫu thuật. Hai nhóm tham gia nghiên cứu này nhận được thông tin theo hai hình thức trình bày khác nhau về tỉ lệ sống sót ngắn hạn sau phẫu thuật, theo đó tỉ lệ này mang hàm ý rủi ro cao hơn xạ trị. Khi được biết rằng "tỉ lệ sống sót sau 1 tháng là 90%," có đến 84% các bác sĩ chọn phẫu thuật, nhưng con số này giảm chỉ còn 50% khi được biết rằng "tỉ lệ tử vong là 10% trong tháng đầu tiên." Cả hai cụm từ này diễn tả cùng một thực tế, nhưng cách trình bày thông tin đã tạo ra sự thay đổi lớn trong quyết định. Máy móc sẽ không gặp tình trạng này.
Kahneman chỉ ra nhiều tình huống khác mà các chuyên gia đã không thể dự đoán tốt khi đứng trước thông tin phức tạp. Chuyên gia phóng xạ có kinh nghiệm vẫn mâu thuẫn nhau trong 1/5 lần khi phân tích kết quả X quang. Nhà kiểm toán, nhà nghiên cứu bệnh học, nhà tâm lý học, nhà quản lý đều có mâu thuẫn tương tự. Kahneman kết luận rằng nếu có cách dự đoán theo công thức thay vì qua con người, thì chắc chắn phải nghiêm túc cân nhắc dùng công thức.
Dự đoán kém của chuyên gia cũng là chủ đề của quyển sách Moneyball của Michael Lewis. Đội bóng chày Oakland Athletics gặp vấn đề sau khi có ba cầu thủ giỏi nhất trong đội rời đi mà họ lại không có đủ nguồn lực tài chính để mời người thay thế. Giám đốc quản lý của đội, Billy Beane (do Brad Pitt thủ vai trong bộ phim), dùng hệ thống thống kê của Bill James để dự đoán kết quả thi đấu của các cầu thủ. Với hệ thống "máy chém" này, Beane và đội ngũ phân tích đã từ chối các đề xuất của đội tuyển chọn và tự quyết định mua cầu thủ theo ý của họ. Mặc dù chỉ có ngân sách khiêm tốn, đội OA đã qua mặt các đối thủ, tiến đến trận chung kết 2002. Tâm điểm của cách tuyển chọn mới này là không dùng những chỉ báo mà họ từng cho là quan trọng (ví dụ như tỉ lệ cướp gôn và trung bình đánh bóng), chuyển sang những tiêu chí khác (như kết quả bảo vệ gôn, và tỉ lệ chạy gôn). Cách này cũng không tính đến những chỉ số đôi khi thật kỳ quặc. Như một người của đội tuyển chọn đã nhận xét, "Anh ta có bạn gái xấu quá. Bạn gái xấu cho thấy anh ta không tự tin." Với cách đưa ra quyết định như vậy, cũng không có gì ngạc nhiên khi cách dự đoán dựa trên dữ liệu thường cho ra kết quả vượt trội hơn quyết định của con người trong môn bóng chày.
Những tiêu chuẩn mới chú trọng đến đóng góp của cầu thủ vào kết quả chung của đội. Cỗ máy dự đoán mới đã giúp cho OA xác định được những cầu thủ tốt nhưng không được đánh giá cao trong cách làm truyền thống và do đó có giá trị cao hơn với mức giá thấp hơn, nếu xét tương quan đóng góp của họ cho đội. Nếu không có cỗ máy dự đoán, đây là những cầu thủ tiềm năng nhưng bị đội bỏ quên. Đội OA đã tận dụng được những thành kiến này.
Có lẽ chỉ báo rõ ràng nhất về sự khó khăn khi dự đoán bằng con người, ngay cả khi đó là những chuyên gia kinh nghiệm và nổi danh, là trong một nghiên cứu về quyết định cho phép đóng tiền tại ngoại của các thẩm phán ở Mỹ. Tại Mỹ, mỗi năm có 10 triệu quyết định như thế, và một người được phép tại ngoại hay không có ảnh hưởng rất lớn cho gia đình, công việc, và các vấn đề cá nhân khác, chưa kể đến chi phí hoạt động của nhà tù đối với chính phủ. Quan tòa phải đưa ra quyết định dựa trên đánh giá liệu người bị kiện có khả năng trốn chạy hay phạm thêm tội mới trong lúc được tại ngoại, chứ không phải dựa vào kết luận phạm tội cuối cùng. Tiêu chí để ra quyết định đã được xác định rõ ràng.
Nghiên cứu này dùng học máy để tạo ra một thuật toán dự đoán khả năng một bị cáo có thể tái phạm tội hay bỏ trốn trong lúc tại ngoại. Dữ liệu đào tạo là khá lớn: 750.000 người đã được tại ngoại tại thành phố New York trong khoảng thời gian từ 2008 – 2013. Thông tin tổng hợp bao gồm tiền án, tội đang bị cáo buộc, và thông tin nhân khẩu học.
Máy cho ra dự đoán tốt hơn các thẩm phán. Ví dụ, đối với nhóm 1% bị cáo mà máy xếp hạng là nhiều rủi ro nhất, nó dự đoán rằng 62% sẽ phạm thêm tội khác trong lúc tại ngoại. Tuy nhiên, các thẩm phán (không được biết đến cỗ máy dự đoán) đã quyết định cho tại ngoại gần một nửa trong số này. Kết quả dự đoán của máy là tương đối chính xác, khi 63% những bị cáo được máy xếp vào nhóm rủi ro cao trên thực tế đã phạm thêm tội khi được tại ngoại và hơn một nửa không xuất hiện theo lịch triệu tập của tòa. 5% trong nhóm được máy dự đoán là rủi ro cao đã phạm tội cưỡng hiếp hay giết người trong khi tại ngoại.
Nếu làm theo đề xuất của máy, các thẩm phán đã có thể cho tại ngoại số bị cáo tương đương mà vẫn giảm tỉ lệ phạm tội của những người được tại ngoại đến 75%. Hoặc là vẫn giữ tỉ lệ phạm tội không đổi và chỉ phải tạm giam thêm một nửa số bị cáo đã được tại ngoại.
Vậy tình huống là như thế nào? Tại sao các thẩm phán lại có đánh giá khác xa với máy? Một khả năng là các thẩm phán sử dụng thêm những thông tin mà máy không được tiếp cận, ví dụ như vẻ bề ngoài của bị cáo hay thái độ trước tòa. Những thông tin này có thể hữu ích, nhưng cũng có thể gây sai lệch. Xét tỉ lệ phạm tội của nhóm người được tại ngoại thì cũng không phải quá bất hợp lý khi kết luận rằng những thông tin đó phần nhiều là chỉ góp phần làm sai lệch; dự đoán của các thẩm phán nói chung là tệ. Kết quả nghiên cứu còn nhiều dẫn chứng khác bổ sung cho kết luận đáng buồn này.
Dự đoán có vẻ là một việc khó khăn đối với con người trong tình huống này vì tính phức tạp của những yếu tố liên quan đến tỉ lệ phạm tội. Cỗ máy dự đoán làm tốt hơn con người khi tính được sự tương tác phức tạp của nhiều chỉ báo khác nhau. Ví dụ, bạn có thể cho rằng hồ sơ tiền án là chỉ báo chi thấy bị cáo có nguy cơ bỏ trốn cao, nhưng máy lại phát hiện trường hợp đó chỉ đúng khi bị cáo đã thất nghiệp được một thời gian. Nói cách khác, sự tương tác mới là quan trọng nhất, và khi số lượng các yếu tố tương tác càng tăng, khả năng con người đưa ra dự đoán chính xác càng giảm.
Những thiên kiến này không chỉ xuất hiện trong y tế, bóng chày, và luật pháp; chúng là một yếu tố bất biến trong các lĩnh vực chuyên môn. Các nhà kinh tế học nhận thấy nhà quản lý và công nhân thường đối đầu nhau trong dự đoán, và dự đoán một cách đầy tự tin, mặc dù không hề biết rằng họ dự đoán rất kém. Trong một nghiên cứu về tuyển dụng tại 15 công ty dịch vụ lao động kỹ năng đơn giản, Mitchell Hoffman, Lisa Kahn, và Danielle Li nhận thấy khi các công ty này áp dụng bài trắc nghiệm khách quan có thang điểm rõ ràng bên cạnh việc phỏng vấn như thông thường, thì tỉ lệ người nhận việc ở lại cao hơn 15% so với khi họ chỉ quyết định tuyển dụng dựa trên phỏng vấn. Trong nhóm công việc này, trách nhiệm của nhà quản lý là giữ chân người lao động.
Bài trắc nghiệm khá chi tiết, bao gồm những kỹ năng và chỉ báo phù hợp với công việc. Ngoài ra, khi quyền hạn tuyển dụng của nhà quản lý bị hạn chế, họ không được phép gạt bỏ kết quả trắc nghiệm qua một bên đối với những trường hợp có điểm trắc nghiệm không tốt, thì tỉ lệ giữ việc thậm chí còn cao hơn và thời gian giữ việc cũng lâu hơn. Như vậy, ngay cả khi trách nhiệm của nhà quản lý là giữ chân người lao động lâu nhất, bản thân họ cũng là người có kinh nghiệm trong tuyển dụng, cộng thêm kết quả tương đối chính xác từ bài trắc nghiệm, nhà quản lý vẫn đưa ra kết quả dự đoán kém.
Máy cũng có lúc dự đoán kém
Cựu Bộ trưởng Quốc phòng Mỹ Donald Rumsfeld từng phát biểu:
Có những thứ được biết đã biết; có những thứ chúng ta biết là mình biết. Chúng ta cũng biết còn có những thứ chúng ta biết là mình chưa biết; cũng có nghĩa là chúng ta biết có nhiều thứ chúng ta chưa biết. Nhưng vẫn còn những thứ không biết chưa biết, những thứ mà chúng ta còn không biết là mình không biết.
Nếu nhìn lại lịch sử phát triển của quốc gia và những nước tự do khác, có thể thấy nhóm sau cùng ấy mới là những thứ khó nhằn nhất.
Đây cũng là một góc nhìn hữu ích để thấu hiểu về những điều kiện khiến cho cỗ máy dự đoán gặp trục trặc. Thứ nhất, những điều chúng ta biết là đã biết là khi chúng ta có dữ liệu đầy đủ, thế nên chúng ta biết mình có thể cho ra kết quả dự đoán tốt. Thứ hai, điều chúng ta biết là không biết là khi chúng ta có quá ít dữ liệu, thế nên chúng ta biết kết quả dự đoán sẽ gặp khó khăn. Thứ ba, điều chúng ta không biết là chưa biết là những sự việc chưa từng được ghi nhận trong quá khứ hoặc có xuất hiện trong dữ liệu nhưng là không thể xảy ra, nên việc dự đoán là khó khăn, mặc dù có thể chúng ta còn chưa nhận ra. Cuối cùng, một nhóm mà Rumsfeld không đề cập, những điều chúng ta biết là chưa biết, khi mà sự tương quan trong quá khứ có vẻ là khá vững chắc thật ra là kết quả của một yếu tố nào đó mà ta không biết hay không quan sát thấy, và sẽ thay đổi theo thời gian, khiến cho kết quả dự đoán mà chúng ta cho rằng đáng tin cậy trở nên thiếu tin cậy. Cỗ máy dự đoán thất bại trong trường hợp này, khi thật khó mà dự đoán dựa trên những hạn chế đã biết trong thống kê.
Điều ta biết là đã biết
Khi có dữ liệu mạnh, cỗ máy dự đoán làm việc rất tốt. Máy hiểu tình huống, thể hiện qua việc nó cho ra kết quả dự đoán tốt. Và chúng ta cũng biết là kết quả dự đoán này là tốt. Đây là trường hợp lý tưởng cho thế hệ trí tuệ máy hiện nay. Phát hiện gian lận, chẩn đoán y khoa, dự đoán thành tích bóng chày, và quyết định bảo lãnh tại ngoại đều nằm trong nhóm này.
Điều ta biết là không biết
Ngay cả những mô hình dự đoán tốt nhất hiện nay (và trong tương lai gần) đều cần nguồn dữ liệu lớn, nghĩa là chúng ta biết rằng kết quả dự đoán của mình còn kém trong những tình huống mà chúng ta không có nhiều dữ liệu. Chúng ta biết là mình không biết.
Chúng ta có thể không có đủ dữ liệu là do sự việc hiếm khi xảy ra, vì thế dự đoán là khó. Bầu cử tổng thống Mỹ chỉ diễn ra mỗi bốn năm một lần, trong đó ứng viên và môi trường chính trị đều khác nhau. Dự đoán kết quả bầu cử tổng thống trước vài năm là gần như không thể. Cuộc bầu cử năm 2016 cho thấy ngay cả việc dự đoán kết quả trước vài ngày, hay ngay trong ngày cuối cùng, cũng là một việc vô cùng khó. Các trận động đất lớn cũng khá hiếm nên việc dự đoán thời gian, địa điểm, mức độ của động đất cho đến nay vẫn là nhiệm vụ chưa thể hoàn thành. (Mặc dù các nhà nghiên cứu địa chấn vẫn đang dốc sức cho nó.)
Ngược lại với máy móc, con người đôi khi lại vô cùng giỏi trong việc dự đoán mà chỉ có ít dữ liệu. Chúng ta có thể nhận ra gương mặt của một người chỉ gặp qua một hay hai lần, thậm chí là nhìn từ một góc độ khác. Chúng ta có thể nhận ra người bạn học cùng năm lớp 4 sau 40 năm, mặc dù vẻ bề ngoài đã hoàn toàn thay đổi. Từ khi còn nhỏ, chúng ta đã có thể ước tính đường bóng bay (mặc dù lúc đó chúng ta còn chưa đủ khéo léo để bắt chính xác). Chúng ta cũng giỏi so sánh, phân tích tình huống mới và phát hiện những khía cạnh tương tự để dùng trong môi trường mới. Ví dụ, nhà khoa học cách đây hàng chục năm đã biết hình dung nguyên tử như một hệ mặt trời thu nhỏ, và kiến thức này vẫn còn được giảng dạy ở trường học.
Các nhà khoa học máy tính vẫn đang nghiên cứu để làm giảm nhu cầu sử dụng dữ liệu của máy tính, phát triển những kỹ thuật như "học một lần" theo đó máy học cách dự đoán một vật thể sau khi chỉ nhìn thấy nó một lần; nhưng các cỗ máy dự đoán hiện tại vẫn chưa làm được. Bởi vì vẫn còn những trường hợp đã biết là không biết và bởi vì con người vẫn giỏi ra quyết định hơn khi gặp điều mình biết là không biết, những người điều khiển máy móc đã lập trình cho máy gọi con người đến giúp khi gặp trường hợp này.
Điều ta không biết là mình không biết
Để dự đoán thì phải có ai đó nói cho máy biết việc gì cần được dự đoán. Nếu một việc chưa từng bao giờ xảy ra, thì máy cũng không thể dự đoán (ít nhất là nếu không có con người nào biết phân tích kỹ càng và đưa ra trường hợp so sánh hữu ích để máy có thể dự đoán bằng dữ liệu của một thứ khác).
Nassim Nicholas Taleb đã nhấn mạnh đến điều ta không biết mà mình không biết trong tác phẩm Thiên nga đen. Ông đề cập rằng chúng ta không thể nào thật sự dự đoán sự kiện mới từ dữ liệu của quá khứ. Nhan đề quyển sách nhắc đến sự kiện người Châu Âu phát hiện ra một loài thiên nga mới tại Úc. Đối với những người Châu Âu sống ở thế ký 18, thiên nga chỉ có màu trắng. Khi đặt chân đến Úc, họ chứng kiến một loài hoàn toàn mới và đầy bất ngờ: thiên nga đen. Họ chưa từng thấy một con thiên nga đen và do đó không hề có dữ liệu để dự đoán về sự tồn tại của một loài chim như thế. Taleb lập luận rằng sự xuất hiện của những điều mà ta không biết là mình không biết để lại những hệ quả quan trọng – không như sự xuất hiện của thiên nga đen, không có mấy ảnh hưởng đến hướng phát triển của xã hội châu Âu hay châu Úc.
Ví dụ, thập niên 1990 là thời điểm tốt để gia nhập ngành âm nhạc. Doanh số CD tăng đều, đem về doanh thu tăng đều. Tương lai thật sáng sủa. Thế rồi, năm 1999, thanh niên 19 tuổi Shawn Fanning đã phát triển Napsterm một chương trình cho phép người dùng chia sẻ tệp âm nhạc miễn phí trên internet. Chẳng mấy chốc, người ta đã tải về hàng triệu tệp bài hát, và doanh thu của ngành âm nhạc bị ảnh hưởng. Ngành công nghiệp này đến nay vẫn chưa thể lấy lại thời hoàng kim.
Fanning là một ẩn số chưa biết. Cỗ máy dự đoán không thể nào dự đoán sự xuất hiện của anh ta. Ngoài ra, như Taleb và nhiều người khác cũng từng nhấn mạnh, con người đặc biệt kém trong việc dự đoán những điều không biết là mình không biết. Đối đầu với điều không biết là mình không biết thì cả con người và máy móc đều thua đau.
Điều đã biết là chưa biết
Có lẽ điểm yếu lớn nhất của cỗ máy dự đoán là chúng đôi khi cho ra kết quả sai mà vẫn rất tự tin là mình đúng. Như đã trình bày ở trên, trong trường hợp điều không biết là đã biết, con người hiểu rõ sự thiếu chính xác của dự đoán. Kết quả dự đoán thường được đặt trong một dãy tin cậy thể hiện sự thiếu chính xác của nó. Trong trường hợp điều không biết là không biết, con người còn không nghĩ là họ có câu trả lời. Ngược lại, với điều đã biết là chưa biết, cỗ máy dự đoán thường cho ra một câu trả lời cụ thể, nhưng câu trả lời đó hoàn toàn có thể là sai.
Tại sao lại như vậy? Bởi vì, mặc dù dữ liệu tạo ra quyết định, dữ liệu cũng có thể khởi sinh từ quyết định. Nếu máy không hiểu về quy trình ra quyết định đã tạo ra dữ liệu, thì dự đoán của nó có thể không tốt. Ví dụ, giả sử bạn muốn dự đoán liệu bạn có triển khai cỗ máy dự đoán trong tổ chức. Bạn khởi đầu khá tốt. Có thể thấy việc đọc quyển sách này là một chỉ báo khá chính xác về một nhà quản lý có triển khai cỗ máy dự đoán hay không.
Tại sao? Ít nhất là có ba lý do. Thứ nhất, và trực tiếp nhất, nội kiến từ quyển sách này là hữu ích, nên việc đọc nội dung quyển sách này giúp bạn hiểu biết thêm về cỗ máy dự đoán và do đó có thể đưa những công cụ này vào hoạt động kinh doanh một cách hiệu quả.
Thứ hai là một lý do gọi là "nhân quả ngược." Bạn đọc quyển sách này là vì bạn đã sử dụng cỗ máy dự đoán hay đã có kế hoạch cụ thể để triển khai trong tương lai gần. Quyển sách này không khiến cho người ta áp dụng công nghệ; thay vào đó, chính là do ý định muốn áp dụng công nghệ mà bạn mới đọc quyển sách này.
Thứ ba là một lý do gọi là "biến bị bỏ sót." Bạn thuộc nhóm người quan tâm đến các xu hướng công nghệ và quản trị. Do đó, bạn chọn đọc quyển sách này. Bạn cũng dùng những công nghệ mới, ví dụ như cỗ máy dự đoán, trong công việc của mình. Chính thái độ yêu thích công nghệ và quản trị của bạn đã thúc đẩy bạn đọc quyển sách này và áp dụng cỗ máy dự đoán.
Đôi khi sự phân biệt này không quá quan trọng. Nếu bạn chỉ muốn biến một người đọc quyển sách này có áp dụng cỗ máy dự đoán hay không, thì thật sự không cần quan tâm cái nào là nguyên nhân, cái nào là hệ quả. Nếu bạn thấy một người đọc quyển sách này, bạn có thể đưa ra dự đoán khá ổn rằng người đó sẽ áp dụng cỗ máy dự đoán trong công việc.
Đôi khi sự phân biệt này có ý nghĩa quan trọng. Nếu bạn đang suy nghĩ có nên đề xuất quyển sách này cho bạn của mình hay không, bạn sẽ chọn đề xuất nếu nó giúp bạn trở thành một nhà quản lý giỏi hơn trong lĩnh vực cỗ máy dự đoán. Bạn muốn biết điều gì? Bạn sẽ bắt đầu từ việc mình đọc sách. Sau đó bạn nhìn vào tương lai và quan sát xem mình quản trị AI có tốt hơn hay không. Giả sử bạn có thể nhìn thấy rõ được tương lai. Bạn thành công một cách ngọt ngào trong việc quản trị cỗ máy dự đoán, và nó trở thành giá trị cốt lõi của tổ chức, từ đó bạn và tổ chức của mình thành công ngoài sức tưởng tượng. Liệu bạn có thể nói rằng việc đọc sách này đã dẫn đến thành công rực rỡ kia?
Không hẳn.
Để biết được việc đọc sách có tạo ra sức ảnh hưởng nào, bạn cũng cần phải biết chuyện gì xảy ra nếu bạn chưa từng đọc qua quyển sách này. Bạn lại không có dữ liệu đó. Bạn cần quan sát một thứ mà các nhà kinh tế học và thống kê học gọi là "phản thực tế": chuyện gì sẽ xảy ra nếu bạn chọn một hướng hành động khác? Để xác định một hành động tạo ra kết quả thì cần hai dự đoán: thứ nhất, kết quả là gì sau khi hành động, và thứ hai, kết quả là gì nếu hoạt động diễn ra theo một hướng khác. Nhưng điều đó là không thể. Bạn sẽ không bao giờ có được dữ liệu về hoạt động đã không diễn ra.
Đây là một vấn đề thường xuyên gặp trong cỗ máy dự đoán. Đại kiện tướng cờ vua Garry Kasparov trong quyển sách của mình đã nhắc đến một vấn đề có liên quan là thuật toán học máy cho cờ vua:
Khi Michie và các cộng sự viết một chương trình thử nghiệm trò chơi cờ vua học máy dựa trên dữ liệu vào đầu thập niên 1980, nó cho ra kết quả rất buồn cười. Họ đưa vào hàng trăm ngàn nước cờ từ những trận đấu đại kiện tướng, hy vọng máy có thể tính toán xem nước cờ nào hiệu quả, nước cờ nào không. Ban đầu thì có vẻ như cũng tốt. Máy đánh giá nước cờ chính xác hơn so với các chương trình trước đó. Vấn đề xuất hiện khi họ để nó thực sự chơi một ván cờ. Chương trình đặt các quân cờ lên bàn, mở trận tấn công, và ngay lập tức hy sinh quân hậu! Nó thua chỉ sau vài nước đi, vì đã hy sinh quân hậu mà không lấy lại được gì đáng giá. Tại sao nó lại làm như thế? Đó là vì khi một Đại kiện tướng hy sinh quân hậu thì đó hẳn phải là một nước cờ vô cùng thông minh và là một cú đấm chí mạng cho đối thủ. Đối với máy, được học từ toàn là các trận đấu đại kiện tướng, hy sinh quân hậu chính là chìa khóa thành công!
Máy đã đảo ngược trình tự nhân quả. Nó không hiểu rằng các đại kiện tướng hy sinh quân hậu chỉ khi họ có thể tạo ra con đường chiến thắng rõ ràng và nhanh gọn, nó lại cho rằng chiến thắng sẽ đến không lâu sau khi hy sinh quân hậu. Vì thế nó cho rằng hy sinh quân hậu là con đường chiến thắng. Mặc dù vấn đề cụ thể này trong cỗ máy dự đoán đã được xử lý, nhân quả ngược vẫn còn là thách thức cho cỗ máy dự đoán.
Vấn đề này cũng thường xuyên xuất hiện trong kinh doanh. Trong nhiều ngành nghề, giá thấp có tương quan với doanh số thấp. Ví dụ, trong ngành kinh doanh khách sạn, giá trái mùa thường là thấp, và giá cao khi nhu cầu tăng cao nhất và khách sạn gần như kín phòng. Dựa trên dữ liệu này, một dự đoán kém có thể đề xuất rằng tăng giá sẽ giúp bán được nhiều phòng hơn. Con người, chỉ cần có một chút kiến thức về kinh tế học, sẽ hiểu được rằng giá thay đổi là do nhu cầu thay đổi, chứ không phải ngược lại. Như vậy tăng giá sẽ không dễ dàng tăng doanh số. Con người khi đó có thể kết hợp với máy để xác định dữ liệu đúng (ví dụ như quyết định của cá nhân trong việc chọn phòng dựa trên giá) và mô hình phù hợp (có cân nhắc yếu tố mùa vụ và các yếu tố khác tác động đến cung và cầu) để cho ra kết quả dự đoán tốt hơn về doanh số tại các mức giá khác nhau. Như vậy, đối với máy, đây là điều biết là chưa biết, nhưng với con người đã có hiểu biết về các yếu tố ảnh hưởng đến giá, sẽ nhìn nhận đây là điều không biết là đã biết hay thậm chí là điều biết là đã biết, nếu người này có thể thiết lập mô hình phù hợp cho việc định giá.
Vấn đề của điều đã biết là không biết và mối quan hệ nhân quả thậm chí còn quan trọng hơn nếu xuất hiện hành vi chiến lược của những đối tượng khác. Kết quả tìm kiếm của Google là từ một thuật toán bí mật. Thuật toán này chịu ảnh hưởng lớn từ cỗ máy dự đoán dự báo những đường dẫn nào khiến cho người tìm kiếm có khả năng nhấp vào cao nhất. Đối với người quản lý trang web, xếp hạng cao sẽ thu hút được nhiều người tìm đến trang web và tạo ra doanh thu nhiều hơn. Hầu hết những người quản lý trang web điều hiểu được điều này và cố gắng tối ưu để lọt vào mắt xanh của trình duyệt tìm kiếm: họ làm đủ mọi chiêu trò để gia tăng thứ hạng trong danh sách kết quả tìm kiếm của Google. Những chiêu trò này chỉ nhằm mục đích tác động vào thuật toán, và theo thời gian, kết quả tìm kiếm cho ra toàn những đường dẫn rác, không phải thứ người ta thật sự tìm kiếm mà chỉ là những thứ do người quản lý trang web biến hóa qua mặt thuật toán.
Cỗ máy dự đoán có thể làm tốt trong một thời gian ngắn việc dự đoán người ta sẽ nhấp vào đường dẫn nào. Nhưng sau vài tuần hay vài tháng, các nhà quản lý trang web cũng tìm ra được chiêu trò lách luật khiến cho Google lại phải thay đổi toàn diện mô hình dự đoán. Cuộc rượt đuổi mèo và chuột giữa cỗ máy tìm kiếm và người tạo rác cho cỗ máy tìm kiếm này cứ thể diễn ra là vì cỗ máy dự đoán cũng có thể bị qua mặt. Mặc dù Google đã cố gắng mở ra một hệ thống khiến cho việc tạo chiêu trò này không mang lại lợi nhuận, họ cũng phải thừa nhận yếu điểm của việc lệ thuộc hoàn toàn vào cỗ máy dự đoán và phải dùng đến con người để tái tối ưu cho máy khi gặp quá nhiều rác. Instagram cũng là một trận chiến khác diễn ra liên tục với những người tạo rác, và phải liên tục cập nhận thuật toán để loại bớt rác và các nội dung phản cảm. Nhìn rộng hơn, một khi con người đã xác định được vấn đề, thì chúng không còn là điều đã biết là chưa biết. Lúc này hoặc là người ta tìm giải pháp để tạo kết quả dự đoán tốt hơn, biến vấn đề trở thành điều biết là đã biết cần có sự hợp tác giữa con người và máy, hoặc là họ không thể tìm ra giải pháp, biến vấn đề trở thành điều đã biết là không biết.
Cỗ máy dự đoán rất mạnh mẽ nhưng cũng có hạn chế. Nó không thể làm tốt nếu thiếu dữ liệu. Nhiều chuyên gia được đào tạo có thể nhận ra những hạn chế này, có thể là do sự kiện hiếm khi xuất hiện, hay do vấn đề quan hệ nhân quả chưa được xác lập, từ đó mà cải thiện thuật toán dự đoán. Ta cần phân biệt giữa dự đoán kết quả (đánh giá đơn thuần trên kết quả của cỗ máy dự đoán) và dự đoán việc quyết định làm thay đổi kết quả (khi đó cần có thêm những phân tích khác). Để hiểu được sự khác biệt và tận dụng hiệu quả cỗ máy dự đoán, thì con người cần phải hiểu được máy.
Kết hợp để dự đoán tốt hơn
Đôi khi, sự kết hợp giữa người và máy tạo ra kết quả dự đoán tốt nhất, hai bên sẽ bổ sung cho điểm yếu của nhau. Năm 2016, đội nghiên cứu AI của Harvard/MIT đã thắng giải đấu Camelyon Grand Challenge, là cuộc thi dùng máy tính phát hiện ung thư vú di căn từ các ảnh chụp sinh thiết. Thuật toán học sâu của đội này đã dự đoán đúng 92,5% số lần so với kết quả của một chuyên gia bệnh lý học là 96,6%. Thoạt nhìn thì đây là chiến thắng của con người, nhưng khi các nhà nghiên cứu kết hợp dự đoán của thuật toán và của chuyên gia thì họ đạt được kết quả đúng là 99,5%. Như vậy là tỉ lệ đoán sai của chuyên gia từ 3,4% giảm xuống chỉ còn 0,5%. Đây là mức giảm 85%.
Đây là trường hợp phân chia lao động kinh điển, tuy không phải phân chia vật lý như mô tả của Adam Smith. Thay vào đó, đây là sự phân chia nhận thức mà nhà kinh tế học và nhà tiên phong máy tính Charles Baggage đã từng mô tả vào thế kỷ 19: "hiệu quả của việc phân chia lao động, kể cả quy trình vật lý và tư duy, đó là nó cho phép chúng ta mua và sử dụng chính xác lượng kỹ năng và kiến thức cần thiết."
Con người và máy có điểm mạnh tại những khía cạnh khác nhau trong dự đoán. Chuyên gia bệnh lý học thường đúng khi chẩn đoán là có ung thư. Rất hiếm khi có trường hợp mà con người chẩn đoán là ung thư nhưng lại sai. Ngược lại, AI lại chính xác hơn khi chẩn đoán không có ung thư. Con người và máy gặp sai lầm theo hai hướng khác nhau. Khi nhận thức được năng lực khác biệt này, sự kết hợp giữa con người và máy trong dự đoán bù đắp cho điểm yếu của nhau, nên làm giảm đáng kể tỉ lệ sai sót.
Sự kết hợp này có thể thực hiện được trong môi trường kinh doanh như thế nào? Cỗ máy dự đoán có thể gia tăng năng suất dự đoán của con người theo hai hướng chung. Thứ nhất là đưa ra dự đoán ban đầu để con người dựa theo đó mà đưa ra đánh giá riêng của mình. Thứ hai là đưa ra ý kiến thứ hai dựa trên dữ liệu, hay một hướng theo dõi. Bằng cách này, người chủ có thể đảm bảo con người đang thật sự nghiêm túc và chăm chút cho kết quả dự đoán. Nếu không có sự theo dõi, con người có thể không thật sự dốc hết sức. Giả thiết ở đây là nếu con người phải trả lời tại sao kết quả dự đoán của họ lại rất khác so với một thuật toán khách quan và muốn kết quả này được chấp nhận thì họ phải bỏ công sức đảm bảo họ đủ tự tin bảo vệ kết quả của mình.
Một nơi thích hợp để đánh giá sự tương tác giữa người và máy là dự đoán điểm tín dụng của người đi vay. Daniel Paravisini và Antoinette Schoar đã xem xét kết quả đánh giá những hộ kinh doanh nhỏ vay tiền tại một ngân hàng ở Colombia sau khi có hệ thống chấm điểm tín dụng mới. Hệ thống chấm điểm tự động sử dụng nhiều thông tin đa dạng của người đi vay và tổng hợp thành một thước đo duy nhất là điểm tín dụng để dự báo rủi ro. Sau một đó hội đồng cho vay bao gồm các nhân viên ngân hàng sử dụng số điểm này kết hợp với quy trình riêng của họ sẽ chấp thuận, từ chối, hay chuyển hồ sơ vay sang cho giám đốc chi nhánh quyết định.
Một thử nghiệm ngẫu nhiên có kiểm soát, không phải là chỉ thị của cấp trên, theo dõi xem điểm tín dụng được đưa ra trước hay sau khi quyết định. Điểm tín dụng như vậy là cơ sở để đánh giá tác động đến quá trình ra quyết định. Một nhóm nhân viên nhận được điểm số ngay trước khi họ họp lại để phân tích. Đây là cách hợp tác thứ nhất với máy, cỗ máy dự đoán là cơ sở cho quyết định của con người. Một nhóm nhân viên khác chỉ nhận được điểm số sau khi đã có phân tích cơ bản. Đây là cách hợp tác với máy thứ hai, theo đó cỗ máy dự đoán hỗ trợ theo dõi chất lượng của quyết định của con người. Sự khác biệt giữa cách thứ nhất và cách thứ hai cho thấy điểm tín dụng có cung cấp thêm thông tin cho người ra quyết định.
Trong cả hai trường hợp, điểm tín dụng đều có đóng góp, nhưng sự cải thiện là lớn nhất khi điểm số được đưa ra trước. Khi đó, hội đồng đánh giá đưa ra quyết định tốt hơn và không cần đẩy lên cấp quản lý cao hơn. Kết quả dự đoán trao quyền cho nhà quản lý cấp thấp. Trong trường hợp còn lại, khi hội đồng nhận được điểm tín dụng sau khi đã ra quyết định, quá trình ra quyết định cũng được cải thiện vì kết quả dự đoán giúp ban quản trị theo dõi hiệu quả của hội đồng. Nó thúc đẩy hội đồng phải cố gắng đảm bảo chất lượng cho các quyết định của mình.
Để sự kết hợp giữa con người và máy tạo ra kết quả dự đoán tốt hơn thì ta phải hiểu được điểm hạn chế của con người và máy. Trong trường hợp của hội đồng phê duyệt khoản vay, con người thường đưa ra dự đoán bị thiên lệch, hay đôi khi không đổ ra công sức. Máy thì lại thiếu thông tin. Mặc dù chúng tôi nhấn mạnh đến sự hợp tác, nhưng không nhất thiết con người và máy phải bắt tay thành một nhóm. Để con người hoàn thiện dự đoán của máy, hay ngược lại, thì điều quan trọng là phải hiểu điểm yếu của cả hai bên, con người và máy, để từ đó có hướng kết hợp loại bỏ những thiếu sót này.
Dự đoán bằng ngoại lệ
Một lợi ích lớn khác của cỗ máy dự đoán là chúng có thể mở rộng quy mô mà con người không thể. Một điểm yếu là chúng chật vật khi phải đưa ra dự đoán trong những tình huống bất thường không có dữ liệu quá khứ. Kết hợp lại, sự kết hợp người và máy trong dự đoán thường là dưới hình thức "dự đoán bằng ngoại lệ."
Như đã thấy, cỗ máy dự đoán học tập khi dữ liệu dồi dào, tức là những trường hợp kịch bản quen thuộc, thường xuyên. Trong tình huống này, cỗ máy dự đoán có thể tự vận hành mà không cần đối tác con người quan tâm. Ngược lại, khi gặp ngoại lệ là một kịch bản không theo lối mòn, nó sẽ được thông báo đến cho con người, và con người chịu trách nhiệm cải thiện hay xác thực kết quả dự đoán. Cách "dự đoán bằng ngoại lệ" này chính là cách làm của ngân hàng tại Columbia.
Khái niệm dự đoán bằng ngoại lệ đã có tiền lệ trong ngôn ngữ quản trị là "quản trị bằng ngoại lệ." Khi đưa ra dự đoán, con người có thể được xem như là nhà quản lý của cỗ máy dự đoán. Một nhà quản trị có nhiều nhiệm vụ khó khăn; để tối ưu hóa thời gian của con người, cách tốt nhất là chỉ cần con người quan tâm khi thật sự cần thiết. Trong trường hợp này, do chỉ cần quan tâm một cách không thường xuyên, con người có thể khai thác được lợi thế của cỗ máy dự đoán cho những tình huống thường xảy ra. Con người chỉ cần can thiệp khi máy không có đủ dữ liệu để đưa ra kết quả dự đoán tốt.
Điểm chính
· Con người, ngay cả là chuyên gia, cũng đưa ra dự đoán kém trong một số trường hợp. Con người thường đặt nặng vào những thông tin nổi bật và không tính đến các yếu tố thống kê. Nhiều nghiên cứu khoa học cho thấy khuyết điểm này xuất hiện trong đa dạng các ngành nghề. Hiện tượng này đã được kể lại trong bộ phim Moneyball.
· Máy và người có những điểm mạnh và điểm yếu riêng trong lĩnh vực dự đoán. Khi cỗ máy dự đoán được cải thiện, các doanh nghiệp cần phải điều chỉnh sự phân chia lao động giữa người và máy. Cỗ máy dự đoán làm tốt hơn con người khi cân nhắc sự tương tác phức tạp giữa các chỉ báo khác nhau, đặc biệt là trong những tình huống có dữ liệu đầy đủ. Khi số lượng các khía cạnh phải cân nhắc ngày càng tăng lên, khả năng con người đưa ra dự đoán chính xác lại càng giảm, nếu so sánh với máy. Tuy nhiên, con người lại làm tốt hơn máy khi việc thấu hiểu quá trình thu thập dữ liệu có thể tạo ra lợi thế trong dự đoán, đặc biệt là khi dữ liệu quá mỏng. Chúng tôi đã đưa ra những bối cảnh dự đoán hữu ích để cân nhắc cách phân chia lao động hợp lý.
· Cỗ máy dự đoán có thể nhân rộng. Giá đơn vị cho mỗi dự đoán giảm dần khi tần suất sử dụng tăng lên. Dự đoán của con người lại không thể nhân rộng theo cách này. Tuy nhiên, con người có mô hình nhận thức về cách vận hành của thế giới và do đó có thể đưa ra dự đoán từ một lượng dữ liệu ít ỏi. Chúng tôi tiên đoán sự phổ biến của hình thức con người dự đoán bằng ngoại lệ, theo đó máy chịu trách nhiệm đưa ra phần lớn các dự đoán dựa trên dữ liệu thường xuyên, lặp lại, nhưng khi có sự kiện hiếm xuất hiện thì máy nhận ra nó không thể dự đoán một cách tự tin, nên nó gọi sự hỗ trợ của con người. Con người khi đó chỉ dự đoán bằng ngoại lệ.
Bạn đang đọc truyện trên: Truyen2U.Com