Mình có gì trên Facebook đâu mà sợ lộ

Đây là một trong những ngộ nhận dễ thấy nhất của nhiều anh em Tinh tế cũng như người dùng Internet hiện nay. Facebook toàn đăng ảnh ăn chơi và chụp với bồ thí có gì mà sợ lộ, có phải nguyên thủ quốc gia hay doanh nhân gì đâu. Cũng đúng, nhưng chưa phải là tất cả những gì bạn có thể nghĩ tới. Thông qua Facebook, những kẻ có ý đồ xấu có thể thay đổi cách bạn tiếp nhận thông tin, và dần dần cũng thay đổi được hành vi của bạn đấy. Anh em hãy đọc để biết, và chia sẻ với người thân, bạn bè của mình nhé.

Mọi chuyện bắt đầu từ những cảnh báo của các chuyên gia bảo mật về việc bạn cần phải bảo vệ tài khoản Facebook của mình tốt hơn, từ những thứ bạn đăng lên, thông tin đăng nhập cho đến các cookie tài khoản được Facebook tự động tạo khi bạn sử dụng mạng xã hội này. Khi ấy, rất nhiều bạn cho rằng thông tin của bạn trên Facebook không hề có giá trị gì cả, cùng lắm là đem đi bán quảng cáo mà thôi.

Nhưng bạn đã sai. Theo Chris Wylie (ảnh dưới) - nhà khoa học dữ liệu kiêm cựu Giám đốc nghiên cứu của Cambrige Analytica, người đã giúp xây dựng công ty này và cũng là người đã công khai việc thu thập, khai thác dữ liệu trái phép của 87 triệu người dùng Facebook với thế giới - thì mọi thứ bạn đăng trên Facebook phản ánh con người của bạn.

Bạn chia sẻ thông tin, bạn kết bạn với người khác, bạn checkin những khi đi chơi, nói về những phiền muộn của mình với đồng nghiệp hay người thân. Bạn lên Facebook khoe một cái điện thoại mới mua, hay nói về việc con chó của mình mới chết ra sao... Tất cả những thông tin này, khi được thu thập lại và cho chạy qua một thuật toán, sẽ vẽ ra hồ sơ về con người của bạn, về tính cách, công việc, gia đình, sở thích, mối quan tâm, thói quen mỗi ngày...

Trong lĩnh vực dữ liệu, việc này gọi là data mining, tạm gọi là đào dữ liệu. Trong data mining, người ta sẽ dùng dữ liệu để tìm ra những đường nét chung của một sự vật, sự việc nào đó, và trong trường hợp của Cambridge Analytica, họ vẽ ra con người của bạn. Cách làm thực ra không phức tạp như bạn nghĩ: họ sẽ dùng một số dữ liệu mẫu, đánh dấu à thằng này thích chơi game, thằng kia thích nói chuyện phét, con bé nọ thì thích bà tám chuyện showbiz. Dựa vào các mẫu này, các thuật toán machine learning sẽ học hỏi (train) và có thể dự đoán được con người của bạn như thế nào (predict). Google, Facebook và các công ty quảng cáo nói chung đã sử dụng phương pháp này từ rất lâu rồi.

Khi người ta đã biết bạn là ai, ở đâu, làm gì, thích gì, việc họ khai thác bạn là chuyện dễ ẹc. Chẳng cần bạn phải là tổng thống hay doanh nhân thành đạt gì đâu, người ta chỉ cần đưa cho bạn đúng cái bạn thích là bạn sẽ vô thức "cắn mồi". Ví dụ, bạn là game thủ, bạn đang chơi Facebook mà thấy quảng cáo giảm giá chuột Razer xịn 50% thì khả năng cao là bạn sẽ bấm vào.

Phân tích của Cambridge Analytica về số người bỏ phiếu, đặc tính của những người này, nhóm tuổi, giới tính, các vấn đề mà họ gặp phải...

Nhưng đó là chuyện của quảng cáo định hướng, chuyện của nhiều năm trước. Giờ đây, bạn có thể bị điều chỉnh hành vi khi họ đưa cho bạn đúng thông tin bạn muốn tiếp nhận, theo đúng góc nhìn của cá nhân bạn. Đây cũng là cách mà Cambridge Analytica thay đổi cách cử tri Mỹ khi họ chuẩn bị đi bầu cử tổng thống hồi năm 2016.

Từ việc học hỏi hồ sơ Facebook của bạn, Cambridge Analytica xây dựng thêm các tin vịt, các trang web, các đoạn video và tiếp cận với bạn không chỉ trên Facebook mà từ những nơi khác nữa. Theo thời gian, bạn sẽ bị ảnh hưởng (hay gọi hoa văn hơn là bị thuyết phục) mà không biết mình đang bị người khác tác động vào.

Mấy thứ này đúng ra chẳng có gì ghê gớm hay viễn tưởng. Các chuyên gia tâm lý, xã hội học đã nghiên cứu và sử dụng các biện pháp tương tự từ rất lâu rồi, và đã có nhiều nghiên cứu về việc hành vi, quan điểm của bạn bị thay đổi nếu tiếp cận đúng cách. Chỉ khác là giờ đây người ta có thêm sự hỗ trợ của dữ liệu của bạn từ Facebook nên quá trình này sẽ chính xác hơn và diễn ra nhanh hơn. Thông tin này do chính Chris Wylie tiết lộ và xác nhận Cambridge Analytica có dùng, và cũng là lý do mà họ nhận được nhiều triệu đô la đầu tư từ một tỉ phú ở New York. Và đấy, những thông tin Facebook đó đến từ những người bình thường, những người chẳng phải là doanh nhân hay nguyên thủy gì cả.

Sẵn tiện chia sẻ luôn cách mà người ta có thể lấy dữ liệu của bạn trên Facebook. Có hai cách thường thấy: lấy qua API và lấy từ việc phân tích web (crawling, hay scrapping).

Việc lấy qua API đòi hỏi nhiều quyền hơn và đa số phải được người dùng chấp thuận, đây là cách mà các app đăng nhập Facebook hay app trên Facebook thường dùng. Lấy qua API sẽ có thông tin nhanh và dễ hơn.

Còn để lấy bằng crawling, các tài khoản của những công ty dữ liệu như Cambridge Analytica sẽ tạo tài khoản ảo, sau đó đi kết bạn với người khác. Khi mạng lưới bạn bè đã hình thành, một con bot tự động sẽ đi vào mục Friends của các tài khoản Facebook, dò tìm những người khác trong đó và "bò" sang trang cá nhân của họ. Ở mỗi tài khoản, con bot này sẽ mổ xẻ các tag HTML của trang web để lấy được thông tin mà nó cần, đánh dấu người này là ai, sở thích ra sao, các bài post hay hình ảnh thường nói về chuyện gì, sau đó lưu dữ liệu xuống server và tiếp tục đi sang người khác. Bản thân Google cũng dùng cách crawling để thu thập dữ liệu của các website phục vụ cho bộ máy tìm kiếm khổng lồ của hãng.

Bài này là một lời cảnh báo với không chỉ anh em Tinh tế mà còn với mọi người, rằng bạn phải bảo mật thông tin của mình một cách tối đa, không để cho bất kì bên nào lợi dụng, và quan trọng hơn, bạn phải nâng cao ý thức của chính mình và phải bỏ ngay suy nghĩ "Mình thì có gì để hacker lấy".

Nguồn Tinh Tế: https://tinhte.vn/threads/minh-co-gi-tren-facebook-dau-ma-so-lo.2785391/