Theo các tác giả Viktor Mayer-Schoenberger và Kenneth Cukier, về cơ bản, dữ liệu có thể được khai thác theo hai hướng chính. Một là đối với những dữ liệu "đếm không xuể" thì phải sử dụng lượng thông tin – "số mẫu" càng nhiều, càng lớn càng tốt, nhờ ưu thế về công nghệ. Hai là đối với những dữ liệu hữu hạn hơn thì "Big Data" đơn giản chỉ là "mổ xẻ" trọn vẹn và triệt để tất cả số mẫu thu thập được, thay vì số mẫu ngẫu nhiên.
Dựa theo lý thuyết này, giáo sư Steven Levitt tại Đại học Chicago - Mỹ đã phát hiện ra những tiêu cực trong môn thể thao Sumo, môn thể thao hoàng tộc, quốc hồn quốc túy của Nhật Bản, nơi mà người ta thường chối biến những cáo buộc gian lận.
Giáo sư này đã thống kê lại toàn bộ hơn 64,000 trận đấu Sumo trong vòng 11 năm (một con số quá khiêm tốn trong lĩnh vực Big Data) để săn lùng những bất thường và ông đã bắt được vàng: thay vì các trận tranh ngôi vô địch, kết quả bất thường lại hay diễn ra ở những trận đấu cuối mùa giải mà ít người quan tâm. Đó là những trận quyết định việc trụ hạng*, nơi những đô vật mấp mé trụ hạng thường giành chiến thắng nhiều hơn 25% so với bình thường trước những đô vật giỏi hơn mình và đã chắc suất trụ hạng.
Khi dữ liệu được phân tích xa hơn, nó còn chỉ ra rằng những đô vật đã "nhả" đối thủ trong các trận đấu này thường sẽ thắng lại ở các trận đấu về sau vì vậy chiến thắng trước đó dường như một "món quà" mà họ đã ban cho đối thủ. Những thông tin này luôn luôn tồn tại rõ ràng và sờ sờ trước mắt nhưng khi không có thống kê trọn vẹn thì những cáo buộc không thể thuyết phục.
Chuyển sang câu chuyện của V-League, trước tới nay người ta vẫn luôn luôn nghi ngờ và đồn thổi với nhau về những câu chuyện 3 đi 3 về, về những vụ bắt tay đôi – tay ba hay hình thức bán độ khác nhưng tất cả chỉ dừng lại là những lời đồn.
Vòng 18 V-League 2018 chứng kiến cơn mưa bàn thắng trên SVĐ Hàng Đẫy khi Hà Nội thắng TP HCM với tỉ số 6-3. Ảnh: Tiến Tuấn.
Việc không có một thống kê cụ thể và toàn diện như của giáo sư Steven Levitt khiến những người quan tâm hay có trách nhiệm với bóng đá Việt Nam dễ dàng tặc lưỡi ném những nghi ngờ của mình ra khỏi đầu óc bận rộn, để tiếp tục với dòng chảy không ngừng của bóng đá. Nghiên cứu của giáo sư Steven Levitt cũng chỉ bắt đầu từ những hồ nghi, từ những lời cáo buộc bị chối bỏ và tiến hành trên những dữ liệu được bày ra công khai trước mặt thiên hạ, những thứ V-League cũng hoàn toàn có thể làm được.
Có một bất thường ở V-League khá giống với ví dụ về Sumo của Nhật Bản và có thể là chỉ dấu ban đầu để tiến hành những nghiên cứu tương tự của giáo sư Steven Levitt. Đó là khi người ta ít tập trung, ít theo dõi giải đấu quốc nội thì những kêt quả "kì lạ" thường xảy ra.
Những vòng đấu có kết quả "không tưởng" ở V-League diễn ra tại thời điểm trùng với các giải đấu lớn trên thế giới. Thống kê: Phạm Minh Cường.
Một thống kê ở quy mô siêu nhỏ từ 2014 tới nay cho thấy, cứ mỗi khi cả thế giới hướng về một giải bóng đá lớn như World Cup hay Euro thì V-League sẽ xuất hiện một vòng đấu có số bàn thắng tăng đột biến đến không tưởng. Tại vòng 19 V-League 2014 diễn ra vào ngày 22/6/2014, trùng thời điểm World Cup diễn ra ở Brazil, 6 trận đấu có tổng cộng 41 bàn thằng, trung bình 6.83 bàn một trận, một con số khủng khiếp không chỉ với BĐVN mà còn với cả bóng đá thế giới.
Tương tự, tại thời điểm diễn ra Euro 2016, vòng 15 V-League 2016 có số bàn thắng trung bình gần 4.5 bàn/trận (31 bàn 7 trận), gấp 1.5 lần con số trung bình của cả mùa giải. Và mới đây thôi, Chủ nhật tuần trước, thời điểm chúng ta vẫn mải mê với trái bóng World Cup ở nước Nga thì một con số không tưởng đã lại xuất hiện, 4 trận đấu có tới 29 bàn thắng, trung bình 7.25 bàn/trận.
Nếu đưa phân tích đi xa hơn nữa chúng ta thậm chí còn dễ dàng tìm ra được CLB nào đóng góp tích cực nhất cho những kết quả này. Những điều bất thường tương tự thế này cần được mổ xẻ và thống kê đầy đủ để có thể lôi ra những góc tối khác nữa nếu có của V-League.Thậm chí ngay từ thời điểm 2014, HLV lão làng Trần Văn Phúc đã đưa ra nhận xét: từ khi kết quả V-League xuất hiện trên các trang cập nhật tỉ số hay các trang cá độ lớn của quốc tế, số bàn thắng V-League tăng lên đáng kể. Cũng nên nhớ ràng, bán độ "tài-xỉu" là thứ bán độ dễ dàng nhất mà các cầu thủ có thể thực hiện.
Theo đó chỉ cần trận đấu có tổng số bàn thắng nhiều hơn một con số do nhà cái đưa ra là bên đặt cược "tài" sẽ thắng, bất chấp kết quả thắng thua. Do vậy các cầu thủ không khó đá như kèo thắng – thua khác. Trường hợp 9 cầu thủ CLB Ninh Bình bán độ và bị ra tòa cũng là do bán độ 1 kèo "tài-xỉu" như vậy.