
Sự phát triển của công nghệ và phân tích dữ liệu trong bóng đá đã mang lại những bước tiến quan trọng trong việc nâng cao tính minh bạch và sự công bằng trong thể thao.
Tuy nhiên, câu chuyện của Lucas Paqueta, cầu thủ thuộc West Ham United, đã chỉ ra rằng việc sử dụng dữ liệu trong bóng đá có thể dẫn đến những kết luận sai lầm nếu không được áp dụng một cách chính xác và cẩn thận. Vụ việc của Paqueta, trong đó anh bị FA (Liên đoàn bóng đá Anh) cáo buộc dàn xếp tỷ số nhưng cuối cùng được miễn tội, đã làm nổi bật một vấn đề quan trọng về cách thức và mục đích sử dụng dữ liệu trong việc điều tra hành vi gian lận trong thể thao.
Quá trình điều tra và sự phụ thuộc vào dữ liệu
Vào tháng 7 năm 2025, cầu thủ Brazil đã được trắng án sau khi bị FA cáo buộc dàn xếp tỷ số trong bốn trận đấu. Cuộc điều tra kéo dài gần 12 tuần và đã chỉ ra những lỗ hổng trong quá trình sử dụng dữ liệu để đưa ra kết luận.
FA đã dựa vào phân tích từ Stats Perform Integrity Services (SPIS), một nhánh của công ty dữ liệu Stats Perform, để tìm kiếm sự bất thường trong các trận đấu mà Paqueta tham gia. SPIS sử dụng các chỉ số từ Opta, như số lần phạm lỗi, số pha tranh chấp và tắc bóng của Paqueta, so với mức trung bình của anh trong mùa giải.
Mặc dù việc sử dụng dữ liệu để phát hiện các hành vi gian lận là một bước tiến quan trọng trong việc bảo vệ sự công bằng của môn thể thao này, nhưng việc chỉ dựa vào một số liệu đơn lẻ, như số pha tắc bóng hay tranh chấp, có thể dẫn đến những kết luận sai lầm. Đặc biệt là trong bóng đá, nơi có rất nhiều yếu tố tác động đến kết quả trận đấu mà dữ liệu không thể bao quát hết, như chiến thuật của đối thủ, tỷ lệ kiểm soát bóng của đội bóng và bối cảnh cụ thể của trận đấu.
Dữ liệu và sự thiếu ngữ cảnh
Một vấn đề lớn trong vụ án cựu sao AC Milan là việc các chỉ số được sử dụng thiếu ngữ cảnh và không phản ánh đầy đủ tình huống thực tế của trận đấu. Ví dụ, số lần phạm lỗi và tắc bóng thường tăng lên khi một đội bóng kiểm soát ít bóng hơn. Điều này có nghĩa là các chỉ số này không thể chỉ ra một hành vi gian lận mà chỉ đơn giản là phản ánh sự khác biệt trong phong cách chơi của đội bóng.
Dữ liệu trong bóng đá không thể được sử dụng một cách đơn giản để xác định hành vi của một cầu thủ mà không xem xét các yếu tố khác. Mỗi trận đấu có những điều kiện riêng biệt, từ lối chơi của đối thủ đến các quyết định của trọng tài, và tất cả những yếu tố này đều có thể ảnh hưởng đến các chỉ số mà người ta thu thập được. Việc bỏ qua những yếu tố này và chỉ dựa vào một vài con số có thể dẫn đến những kết luận sai lệch, như trong trường hợp của Paqueta.

Chọn lọc số liệu và nguy cơ tạo ra thiên kiến
Một trong những vấn đề lớn hơn với việc sử dụng dữ liệu trong bóng đá là hiện tượng “cherry-picking” — tức là việc chọn lọc các số liệu phù hợp với một giả thuyết sẵn có. Đây là một dạng của “confirmation bias” (thiên kiến xác nhận), khi các nhà phân tích hoặc báo chí chỉ tập trung vào các chỉ số giúp củng cố quan điểm của mình, bỏ qua các số liệu không phù hợp.
Điều này rất nguy hiểm vì nó có thể dẫn đến những hiểu lầm về hiệu suất của cầu thủ hoặc đội bóng. Trong một môn thể thao như bóng đá, nơi có rất nhiều yếu tố tác động đến kết quả, việc chỉ sử dụng một số liệu đơn giản và thiếu ngữ cảnh là không đủ để đưa ra kết luận chính xác.
Tầm quan trọng của phân tích dữ liệu có trách nhiệm
Câu chuyện của Paqueta là một lời cảnh tỉnh cho tất cả những ai sử dụng dữ liệu trong bóng đá. Mặc dù công nghệ và dữ liệu có thể mang lại những cái nhìn sâu sắc và hỗ trợ quyết định trong bóng đá, nhưng việc áp dụng dữ liệu cần phải tuân thủ các nguyên tắc khoa học và phải được kiểm tra một cách cẩn thận. Phân tích dữ liệu cần phải được thực hiện trong một bối cảnh rộng hơn, với sự hiểu biết về các yếu tố tác động đến trận đấu và hiệu suất của cầu thủ.
Điều này cũng nhấn mạnh sự cần thiết phải có một quy trình nghiêm ngặt trong việc thu thập và phân tích dữ liệu. Dữ liệu cần được sử dụng một cách có trách nhiệm và phải đứng vững dưới sự đánh giá và phản biện của các chuyên gia trong lĩnh vực. Điều này đặc biệt quan trọng trong bối cảnh bóng đá ngày nay, khi dữ liệu ngày càng trở thành công cụ không thể thiếu trong việc phân tích và cải thiện hiệu suất.

Lời kết
Câu chuyện của cầu thủ Brazil và vụ việc liên quan đến việc sử dụng dữ liệu trong điều tra hành vi gian lận đã chỉ ra rằng, mặc dù dữ liệu có thể mang lại những lợi ích lớn trong bóng đá, nhưng cũng có thể bị hiểu sai và sử dụng sai mục đích nếu không được phân tích đúng cách.
Việc sử dụng dữ liệu trong thể thao cần phải được thực hiện một cách có trách nhiệm, với sự hiểu biết rõ ràng về bối cảnh và các yếu tố tác động. Mọi người có thể sử dụng dữ liệu, nhưng để đạt được những kết quả đáng tin cậy và có ý nghĩa, việc diễn giải dữ liệu một cách chính xác và khoa học là điều quan trọng nhất.