Truyen2U.Net quay lại rồi đây! Các bạn truy cập Truyen2U.Com. Mong các bạn tiếp tục ủng hộ truy cập tên miền mới này nhé! Mãi yêu... ♥

Chương 10. Làm qua loa

Bài học về sự tôn trọng và trách nhiệm sau vụ bỏ meeting đã hằn sâu trong tâm trí Hoàng Ly. Hai tuần tiếp theo, cô hoạt động như một cỗ máy được lập trình hoàn hảo. 

Deadline 6 giờ sáng Chủ Nhật luôn được gửi đi lúc 5 giờ 55. Các buổi meeting 14 giờ 00 Thứ Bảy, cô luôn có mặt ở lab lúc 13 giờ 50, ngồi im lặng ở bàn chờ, chuẩn bị sẵn sàng.

Cô làm việc trong một trạng thái sợ hãi kỷ luật. Nỗi sợ bị mắng, và nỗi sợ bị phạt nặng hơn, đã lấn át đi sự tò mò ban đầu. 

Động lực của cô không còn là khát khao chinh phục kiến thức, mà là để không bị sai, không bị phạt. Cô làm việc để tồn tại trong "trại huấn luyện" của Minh Dương.

Và khi con người ta làm việc chỉ để "không sai", họ sẽ không bao giờ làm "xuất sắc". Họ chỉ làm "đủ".

---

Thứ Hai đầu tiên của tuần thứ tư tháng Mười Một, email giao nhiệm vụ mới đến. Giai đoạn "nền tảng" đã qua, giờ là lúc bước vào "thực chiến".


Tiêu đề: [Roadmap W10] - Đọc Paper Nền Tảng (CNN).

Nội dung:

Em đã có nền tảng toán và thuật toán. Tuần này bắt đầu giai đoạn đọc hiểu các kiến trúc cốt lõi.

Nhiệm vụ: Đọc 3 paper sau đây về Mạng Nơ-ron Tích chập (CNN):

1. "Very Deep Convolutional Networks for Large-Scale Image Recognition" (VGG).

2. "Deep Residual Learning for Image Recognition" (ResNet).

3. "Going Deeper with Convolutions" (GoogLeNet / Inception).

Yêu cầu: Viết summary (tóm tắt) cho mỗi paper.

Deadline: 6:00, Chủ Nhật tuần này.


Hoàng Ly đọc email. Ba bài báo. Ba "gã khổng lồ" trong lịch sử Thị giác Máy tính. Một khối lượng công việc nặng nề.

Cô mở paper đầu tiên, VGG. 14 trang. 

Cô bắt đầu đọc. Abstract và Introduction có vẻ dễ hiểu. Nhưng khi đi vào phần 3, "ConvNet Configurations", cô đâm sầm vào một bức tường. Những bảng kiến trúc chi chít, những lý luận về kích thước bộ lọc 3x3 so với 7x7... Não cô bắt đầu thấy mệt.

Cô liếc nhìn đồng hồ. Mất 2 tiếng mới qua được 3 trang. Mà cô còn 2 paper nữa.

Thói quen cũ, thói quen của "con nhà người ta" chỉ thích làm những thứ dễ dàng, bắt đầu trỗi dậy. "Summary mà," cô tự nhủ. "Chắc anh ấy chỉ yêu cầu tóm tắt ý chính thôi. Như làm bài tập về nhà vậy." 

Sự lười biếng, được che đậy dưới vỏ bọc của "hiệu suất", bắt đầu chiếm quyền kiểm soát. "Một nhà nghiên cứu hiệu quả là phải biết chắt lọc thông tin nhanh," cô tự biện hộ.

Thế là, thay vì "cày" từng chữ như cô đã làm với paper Gradient Descent sau khi bị phạt, Ly bắt đầu "học lướt".

Với mỗi paper, cô chỉ đọc kỹ 3 phần: Tóm tắt (Abstract), Giới thiệu (Introduction), và Kết luận (Conclusion). Phần Phương pháp luận (Methodology) và Thí nghiệm (Experiments) – phần cốt lõi, phần khó nhất – cô chỉ đọc lướt qua, nhặt lấy vài từ khóa.

Cô mở Microsoft Word. Cô bắt đầu viết.

Với paper VGG, cô viết: "Paper này đề xuất một phương pháp mới cho mạng nơ-ron tích chập, sử dụng các bộ lọc 3x3 rất nhỏ. Điều này giúp mạng sâu hơn và đơn giản hơn. Kiến trúc này đã đạt được kết quả tốt trong cuộc thi ImageNet 2014." 

Với paper ResNet: "Paper này giải quyết vấn đề vanishing gradient trong các mạng rất sâu. Phương pháp mới được gọi là 'Residual Learning'. Kết quả cho thấy mô hình sâu hơn (152 lớp) nhưng lại có hiệu suất tốt hơn các mô hình nông." 

Với paper GoogLeNet: "Paper này giới thiệu kiến trúc 'Inception', giúp tăng hiệu quả tính toán. Bằng cách sử dụng các filter với kích thước khác nhau song song, mô hình có thể thu được đặc trưng ở nhiều quy mô. Kết quả cũng rất tốt." 

Hoàn hảo. 

Mỗi tóm tắt dài đúng một trang A4. Rõ ràng, súc tích, và chứa đầy những từ khóa "đúng". Cô đã làm theo kiểu "bài tập về nhà" – hoàn thành nhiệm vụ, nhưng không có một chút hiểu biết thực sự nào đằng sau.

Cô mất cả ngày thứ Sáu chỉ để viết ra 3 trang giấy vô hồn đó. Cô cảm thấy hơi tội lỗi, nhưng cô nhanh chóng gạt đi. "Anh ấy giao 3 paper trong 1 tuần. Ai mà đọc kỹ hết được? Mình làm thế này là đã hoàn thành đủ yêu cầu rồi. Mình đã 'làm đủ'."

5 giờ 58 phút sáng Chủ Nhật, cô gửi email. Cô đã "làm đủ". Cô nghĩ thế là an toàn.

---

Buổi review tuần đó, 14:00 Thứ Bảy.

Ly có mặt ở lab A203 lúc 13:50. Cô ngồi ở bàn chờ, tim đập hơi nhanh, nhưng tự tin rằng mình đã hoàn thành nhiệm vụ. Sẽ không có lý do gì để bị phạt.

Đúng 14:00, Minh Dương ngẩng đầu lên khỏi màn hình của anh ta. 

"Vào đi Ly."

Cô bước đến bàn làm việc của anh ta. Không khí vẫn căng thẳng như mọi khi.

"Mở file summary của em lên," anh ta nói.

Ly cắm laptop của mình vào màn hình phụ trên bàn anh ta. Ba trang tóm tắt hiện lên rõ ràng.

Dương kéo file về phía màn hình của anh ta. Anh ta bắt đầu đọc.

Ly đứng bên cạnh, nín thở. Cô thấy anh ta đọc hết trang 1... rồi trang 2... rồi trang 3...

Quá trình đó mất chưa đầy 2 phút.

Sau khi đọc xong, anh ta không nói gì. Anh ta chỉ ngồi im, mắt nhìn vào màn hình. Rồi anh ta đóng file lại. Màn hình trở về desktop trống rỗng.

Anh ta xoay ghế lại, đối diện với cô.

"Em nghĩ đây là summary?" 

Giọng anh ta bình thản, nhưng cái sự bình thản đó khiến Ly lạnh sống lưng.

"Dạ?" cô chột dạ. "Em... em đã viết đầy đủ các ý chính của mỗi paper rồi mà..." 

"Ý chính?" Dương nhếch mép. Anh ta mở lại file, chỉ vào một câu trong tóm tắt VGG. "Em viết 'phương pháp mới'. Mới ở chỗ nào? So với các phương pháp trước thì khác gì?" 

"Dạ... là dùng filter 3x3 ạ."

"AlexNet trước đó dùng 11x11. ZFNet dùng 7x7. Tại sao 3x3 lại 'mới'? Lợi ích của nó là gì? Em nói nó 'đơn giản hơn'. Đơn giản hơn chỗ nào? So với một lớp 7x7, thì dùng ba lớp 3x3 chồng lên nhau có gì khác?"

Ly cứng họng. Cô đã đọc lướt qua, cô biết là có, nhưng cô không thể giải thích tại sao. "Dạ... nó... nó làm mạng sâu hơn..."

"Sâu hơn để làm gì? 'Trường tiếp nhận' (receptive field) của ba lớp 3x3 là bao nhiêu? So với một lớp 7x7 thì sao? Số lượng tham số (parameters) của cấu hình nào nhiều hơn? Em có biết không?"

Ly lặng im. Cô không biết.

Dương không đợi cô trả lời. Anh ta chỉ vào một câu khác. "Em viết 'kết quả tốt'. Tốt là thế nào?"

"Dạ... nó thắng giải ILSVRC 2014..."

"Tôi không hỏi giải thưởng!" 

Dương gắt lên, giọng anh ta đột ngột cao lên, làm Ly giật bắn mình. 

"Tôi hỏi kết quả! Tốt hơn baseline bao nhiêu phần trăm? Baseline là cái gì? Em có biết không? Top-1 accuracy là bao nhiêu? Top-5 accuracy là bao nhiêu? Họ chạy thí nghiệm trên dataset nào? Dùng metric gì để đánh giá?"

Một loạt câu hỏi dồn dập, chính xác, không cho cô một kẽ hở để thở.

"Em..." Ly hoảng loạn. "Em... không nhớ rõ..." 

"Không nhớ rõ," Dương lặp lại, giọng anh ta lại hạ xuống, lạnh như băng. "Hay là em chưa từng đọc?"

Anh ta kéo sang tóm tắt của ResNet. "Em viết 'giải quyết vấn đề vanishing gradient'. Bằng cách nào? Công thức của 'residual block' là gì? Viết ra cho tôi xem."

Ly run run cầm bút, nhưng cô không thể viết được.

"Em viết 'hiệu suất tốt hơn các mô hình nông'. Cụ thể, mô hình ResNet-34 so với VGG-19, cái nào tốt hơn? Tốt hơn bao nhiêu? Số lượng phép tính (FLOPs) của cái nào ít hơn?"

"Em..."

"Đủ rồi," Dương đóng file lại một lần nữa. "Tức là em chỉ đọc qua, viết cho có."

Anh ta đứng dậy.

Phản xạ của Ly là lùi lại một bước. Bàn tay trái của cô vô thức co lại, giấu sau lưng.

Dương nhận ra hành động đó. Anh ta nhìn cô.

"Em đi theo anh."

Anh ta bước về phía cánh cửa phòng kho nhỏ ở cuối lab. Căn phòng nơi cô đã bị phạt.

Tim Ly như ngừng đập. Cô nín thở, lẳng lặng đi theo.

Anh ta bước vào phòng, bật đèn. Căn phòng chật chội, ngột ngạt. Anh ta ra hiệu cho cô vào, rồi đóng cửa lại. Cạch.

Ly đứng im, run rẩy, mắt nhìn xuống đất.

"Em biết khác biệt giữa một sinh viên giỏi và một sinh viên xuất sắc là gì không?"

Dương hỏi, giọng nói vang vọng trong không gian nhỏ.

Ly lắc đầu, không dám lên tiếng.

"Một sinh viên giỏi, sẽ làm đủ những gì được giao," anh ta nói. "Anh giao đọc 3 paper viết 3 summary. Em nộp 3 trang giấy. Em làm đủ. Em là một sinh viên giỏi." 

"Nhưng một sinh viên xuất sắc," anh ta tiếp tục, "sẽ làm vượt kỳ vọng. Khi nhận nhiệm vụ 'viết summary', họ sẽ tự hỏi: 'Mục đích của việc này là gì? Là để hiểu. Làm thế nào để hiểu? Phải đọc kỹ. Phải so sánh. Phải đặt câu hỏi.' Họ sẽ nộp lại một bản phân tích 15 trang, so sánh ưu nhược điểm của cả 3 kiến trúc, chỉ ra tại sao ResNet lại là một bước đột phá so với VGG. Họ làm vì họ muốn hiểu, không phải làm để đối phó với anh."

Anh ta dừng lại, rồi hỏi một câu chí mạng.

"Em muốn là người nào?" 

Ly im lặng, nước mắt bắt đầu lưng tròng. Cô cảm thấy xấu hổ tột độ.

"Em... em muốn là sinh viên xuất sắc ạ..."

"Vậy tại sao em lại nộp cho tôi báo cáo như vậy?"

Anh ta bước về phía cái tủ tài liệu cũ ở góc phòng. Anh ta đặt tay lên ngăn kéo, nơi anh ta đã cất cây thước gỗ.

Ly nín thở, cả người căng cứng.

"Em có biết em đáng bị gì cho cái tội cẩu thả và đối phó này không?" anh ta hỏi, giọng trầm và đáng sợ.

Ly bật khóc nức nở, cô lắc đầu lia lịa.

Anh ta đứng đó một lúc, rồi từ từ rụt tay lại. 

Anh ta không mở ngăn kéo.

"Lần trước tôi phạt em vì tội thiếu tôn trọng. Lần này," anh ta quay lại, "là tội dối trá trong học thuật. Tội này còn nặng gấp mười lần. Lẽ ra tôi phải phạt em gãy cả cây thước."

Anh ta bước lại gần, đứng đối diện cô. 

Ly run rẩy, không dám ngẩng mặt lên.

"Nhìn tôi," anh ta ra lệnh.

Ly từ từ ngẩng lên, đôi mắt đẫm nước.

"Tôi tha cho em lần này. Không phải vì em không đáng bị phạt," anh ta nói, giọng tàn nhẫn. "Mà vì tôi muốn em nhớ cái cảm giác xấu hổ này. Nhớ rằng em đã may mắn thoát phạt."

"Nhưng nghe cho rõ đây, Hoàng Ly. Đây là lần cuối cùng," anh ta gằn giọng. "Nếu còn một lần nữa em nộp cho tôi một sản phẩm làm việc qua loa, cẩu thả như thế này, tôi sẽ không chỉ dọa. Tôi sẽ không nói nhiều. Tôi sẽ phạt em nặng hơn lần trước rất nhiều. Em hiểu chưa?"

"Dạ... em hiểu rồi ạ..." Ly thút thít.

Dương gật đầu, sự giận dữ đã rút đi, chỉ còn lại sự nghiêm khắc tuyệt đối. 

"Giờ là hình phạt của em."

Anh ta mở cửa. 

"Ra ngoài."

Họ quay lại phòng lab chính. Anh ta ngồi xuống ghế.

"Viết lại," anh ta ra lệnh.

"Dạ vâng... em sẽ viết lại..."

"Mỗi paper, 5 trang. Tối thiểu," anh ta nói. "Anh không quan tâm em viết bao nhiêu. Anh quan tâm em hiểu bao nhiêu."

"Và," anh ta bổ sung, "khi em nộp lại vào Chủ Nhật tuần sau, chúng ta sẽ có một buổi vấn đáp. Anh đã chuẩn bị sẵn 10 câu hỏi cho mỗi paper. Tổng cộng 30 câu. Em phải trả lời được hết. Trả lời sai một câu, nghĩa là em chưa hiểu. Mà chưa hiểu, thì không được phép gửi."

Đó là một hình phạt còn nặng nề hơn cả đòn roi.

"Em có một tuần. Giờ thì về đi."

---

Ly rời khỏi lab, cảm giác như người vừa chết đi sống lại. Lời đe dọa của Dương vẫn còn văng vẳng bên tai cô. "Tôi sẽ phạt em nặng hơn rất nhiều." 

Cô không nghi ngờ điều đó.

Lần này, cô không khóc. Cô cũng không hoảng loạn. 

Cô chỉ cảm thấy một sự quyết tâm lạnh lùng. 

Cô đã chạm đến giới hạn của sự bao dung của anh ta. 

Cô không còn đường lùi.

Cô về phòng. Cô không làm gì khác. Cô tắt mọi thông báo mạng xã hội. Cô nói với bạn cùng phòng rằng mình sẽ "bế quan" một tuần.


Và cô bắt đầu đọc.

Lần này, cô không đọc lướt. Cô đọc từng dòng, từng chữ. Cô mang theo một cuốn từ điển chuyên ngành. Cô dịch từng thuật ngữ mà cô không hiểu.

Cô đọc paper VGG. Cô lấy giấy bút ra, vẽ lại 5 kiến trúc A, B, C, D, E. Cô tự tay tính toán số lượng tham số của một lớp 7x7 và ba lớp 3x3. Và cô nhận ra, ba lớp 3x3 không chỉ có cùng "trường tiếp nhận", mà còn có ít tham số hơn 47%. 

"À, ra là vậy!"

Cô đọc paper ResNet. Cô chép lại công thức H(x) = F(x) + x hàng chục lần. Cô cố gắng hình dung dòng chảy của gradient đi qua "shortcut connection". Cô nhận ra nó đã giải quyết vấn đề đạo hàm bằng 0 bằng cách tạo ra một con đường "cao tốc" cho gradient đi qua.

Cô đọc paper GoogLeNet. Cô vẽ lại cái "Inception module" phức tạp. Cô nhận ra sự thiên tài của việc gộp các đặc trưng ở nhiều quy mô khác nhau lại.

Cô mất một tuần. Một tuần không ngủ đủ giấc. 

Một tuần chỉ có cô và 3 paper.

---

Chủ Nhật, 5 giờ 30 phút sáng. Cô gửi đi một file PDF 18 trang.

Buổi review tuần đó, vẫn là bàn làm việc của Dương. Anh ta cầm bản báo cáo mới. Anh ta đọc kỹ. Lần này, anh ta đọc mất 20 phút.

Sau khi đọc xong, anh ta gật đầu. "Chuẩn bị vấn đáp?"

"Dạ rồi ạ."

"Paper ResNet," anh ta bắt đầu. 

"Câu hỏi số 1: 'Degradation problem' mà paper nhắc đến là gì? Nó khác gì với 'vanishing gradient'?"

Ly hít một hơi. "Dạ, 'degradation problem' là hiện tượng khi mạng sâu hơn, lỗi (error) trên tập huấn luyện lại tăng lên, không phải do overfitting. Điều này khác với 'vanishing gradient'..."

Anh ta hỏi. Cô trả lời.

"Câu số 2: Tại sao 'shortcut connection' lại dùng phép cộng, mà không dùng phép nối (concatenation)?"

"Câu số 3: Trong ResNet-50, 'bottleneck block' là gì? Nó dùng filter 1x1 để làm gì?"

...

Anh ta hỏi tổng cộng 10 câu hỏi ngẫu nhiên trong 30 câu. Ly trả lời không vấp một chữ. Mọi câu trả lời đều đến từ sự hiểu biết cặn kẽ của cô.

Dương nghe xong. Anh ta đặt bản báo cáo xuống. 

Anh ta nhìn cô.

"Giờ mới ra dáng summary."

Ly thở phào, cảm giác như vừa trút được một gánh nặng ngàn cân.

Cô mỉm cười, dù mệt mỏi. "Em... em mới hiểu summary thật sự là gì," cô nói. "Nó không phải là tóm tắt lại. Nó là... giải thích lại."

"Đúng," Dương gật đầu. "Em hiểu được điều đó là tốt. Đừng để anh phải nhắc lại lần thứ ba."

Lời đe dọa vẫn còn lơ lửng, nhưng hôm nay, cô đã vượt qua.

Bạn đang đọc truyện trên: Truyen2U.Com