Yahoo miễn phí 13,5TB dữ liệu

10:51, Thứ Sáu, 15/01/2016 (GMT+7)
Academia là một chương trình kiểm tra kiến thức của người dùng trong nhiều lĩnh vực, gồm nhiều bài kiểm tra bao gồm Tiếng Anh, Toán học, Khoa học, Địa lý, và Lịch sử, và người dùng còn được cung cấp nhiều câu hỏi cho mỗi chủ đề để đảm bảo một nền tảng giáo dục phổ quát.

 

Vừa qua, Yahoo đã quyết định tung 13,5TB dữ liệu miễn phí dành cho Academia, chương trình này phục vụ cộng đồng nghiên cứu khoa học và việc làm của Yahoo sẽ khuyến khích cho những sáng tạo (có lẽ cũng hỗ trợ việc thúc đẩy sáng tạo các sản phẩm của họ). 

Các dữ liệu được thiết lập hoàn toàn ẩn danh, chứa khoảng 110 tỷ sự kiện của tương tác dữ liệu lấy từ khoảng 20 triệu người dùng Yahoo giữa tháng Hai và tháng Năm năm ngoái. Những người dùng này đã có một số trải nghiệm trên những trang web lớn chính yếu của Yahoo như trang chủ Yahoo.com, Yahoo News, Yahoo Sports và Yahoo Finance.

Ngoài ra, bộ dữ liệu cũng chứa thông tin về độ tuổi, giới tính và dữ liệu địa lý tổng quan của hơn 20 triệu người dùng đó.
 
“Về phía các mục, chúng tôi cũng đang phát hành các tiêu đề, tóm tắt và những cụm từ khóa của những bài báo liên quan. Các dữ liệu tương tác là theo thời gian địa phương liên quan cũng như một phần thông tin về các thiết bị kết nối Internet của người dùng, thông tin về những mối quan tâm theo ngữ cảnh trải nghiệm trên web cũng cung cấp một số dữ liệu giúp khai thác về thói quen, sở thích của người dùng”, theo thông báo từ Yahoo đưa ra.
 
Theo TechCrunch, các nhà nghiên cứu tại trường Carnegie Mellon, thuộc đại học California ở San Diego, Mỹ và Trung tâm khoa học dữ liệu Umass Amherst đã lên kế hoạch sử dụng tập dữ liệu của Yahoo trong các nghiên cứu của họ. Nói tóm lại, việc truy cập tới một lượng lớn những thông tin của thế giới thực “real-world” như vậy sẽ giúp các nhà nghiên cứu hỗ trợ tốt hơn các thuật toán của máy móc và kiểm tra tốt hơn những gì người dùng thực sự làm.
 
Ví dụ: Tập hợp dữ liệu của Yahoo có thể giúp các nhà nghiên cứu hiểu tốt hơn làm thế nào để tạo ra các thuật toán để hiển thị những tin tức hấp dẫn, vì mọi người đều có thể truy cập vào một tập hợp dữ liệu như nhau tất cả mọi thứ mọi người đều có thể kích chuột vào, các nhà nghiên cứu có thể so sánh các kỹ thuật của họ và kết quả thu được từ những gì các chiến lược được thực hiện tốt.
 
Chúng ta đều hy vọng rằng, Yahoo không sử dụng những kỹ thuật này để tăng sự hấp dẫn cho các quảng cáo của họ. Mặc dù, công ty gần đây phải đối mặt với một số vụ kiện về việc quét email của người dùng và cung cấp cho họ những quảng cáo có nội dung liên quan đến email đó. Trong khi Yahoo vẫn lên kế hoạch tiếp tục hành động trên với ghi chú rằng họ không làm gì sai cả thì các điều khoản của thỏa thuận mới bao gồm Yahoo đồng ý xây dựng một hệ thống mới có thể phân tích các email “sau khi người dùng Yahoo Mail đã đọc email đó của họ” chứ không phải ngay khi email này được chuyển đến máy chủ của Yahoo.
 
Hải An (Theo PCMag)
.
.
.

.
.
.