Big Data: баланс між інноваціями та цифровим тоталітаризмом

Чи можна знайти компроміс між збором персональних даних та особистою свободою.


У 1980-х та на початку 1990-х років Нью-Йорк вважався небезпечним місцем для життя. У 1990 році кількість убивств у місті сягнула небаченого піку — понад 2200. Тим часом ризик пограбувань та викрадень став щоденною реальністю для близько 7 мільйонів мешканців міста. 17 вересня 1990 року заголовок на обкладинці журналу Time оголосив про «загнивання Великого яблука», посилаючись на «сплеск жорстоких вбивств», через які ньюйоркці відчували себе у небезпеці й не знали, чи варто продовжувати залишатися у місті. У грудні газета New York Times заявила, що вулиці міста нагадують «нову Калькутту», де повно жебраків і сумних шизофреніків, не здатних впоратися з «голосами в голові».

У 1994 році Вільям Браттон обійняв посаду комісара Департаменту поліції Нью-Йорка з амбітною метою: швидко знизити рівень злочинності. Ключовим інструментом його зусиль стала програма комп’ютеризації та кількісної оцінки Compstat, яка дозволила Браттону переорієнтувати департамент на проактивне запобігання злочинності шляхом аналізу даних про злочинність та спрямування основного обсягу ресурсів у райони з найвищим рівнем злочинності. Використання великих даних для прийняття рішень було радикальним нововведенням для департаменту, і воно принесло свої плоди. До кінця десятиліття рівень злочинності у Нью-Йорку знизився вдвічі.

Великі дані (англ. Big Data) — набори структурованої і неструктурованої інформації, а також інструменти, підходи, методи обробки та зберігання даних. Традиційні способи та підходи не можуть бути застосовані до них через об’єм та різноманітність даних.

Існує 7 характеристик великих даних, або «7 V»:

  1. Volume (обсяг). Обсяг даних може бути величезним, охоплюючи терабайти, петабайти або навіть ексабайти інформації.
  2. Velocity (швидкість). Швидкість з якою дані збираються, обробляються та аналізуються в режимі реального часу може бути дуже високою. 
  3. Variety (різноманітність). Великі дані можуть мати різноманітні формати, наприклад, текстова інформація, графіка, аудіо, відео, геолокаційні дані.
  4. Veracity (правдивість). Дані мають бути точними та актуальними. Неправдива або застаріла інформація може призвести до помилкових висновків та стратегічних рішень.
  5. Variability (мінливість). Одні й ті самі дані можуть швидко змінювати свій контекст. Так, з часом залежно від різноманітних обставин, люди можуть змінювати свою поведінку. 
  6. Visualization (візуалізація). Якісне відображення аналізу великих даних робить їх доступними для сприйняття. Це можуть бути діаграми, графіки або інтерактивні карти.
  7. Value (цінність). Кінцевою метою аналізу великих даних є виявлення цінної інформації, яка може допомогти оптимізувати процеси, забезпечити конкурентні переваги та прискорити інноваційний розвиток. 

Інформація впливає практично на всі аспекти людського існування, починаючи від персоналізованих рекламних оголошень в Інтернеті до навігаційних вказівок на наших мобільних телефонах. Великі корпорації давно визнали переваги використання великих обсягів даних для оптимізації своєї діяльності, залучення нових клієнтів та відбору кандидатів на роботу. 

Урядові організації також впроваджують великі дані та алгоритмічні інструменти для прийняття рішень з метою підвищення ефективності, розвитку системи надання послуг та формування політики. Наприклад, в деяких провінціях Китаю органи влади встановлюють численні камери спостереження з функцією розпізнавання облич у житлових будинках чи готелях. Система спостереження також дозволяє розпізнавати відео, номерні знаки слідкувати за трафіком через мережі Wi-Fi, а також відстежувати банківські операції. Окрім цього, у великих масштабах відбувається збір генетичних даних громадян. Сюди входять зразки ДНК, відбитки райдужної оболонки ока та запис голосу. Такі бази даних є щонайменше у 25 китайських провінціях.
Використання великих даних передбачає ряд переваг. Деякі з них включають:

  • Підвищення ефективності рішень: Великі дані дозволяють проводити глибокий аналіз даних, що сприяє прийняттю слушних рішень та оптимізації процесів. 
  • Більш точне прогнозування: Застосування аналітичних моделей на великих даних може допомогти у прогнозуванні тенденцій, попиту та потреб.
  • Інноваційний розвиток: Великі дані стимулюють інновації, відкривати для організацій нові можливості та стратегії розвитку.

Однак, разом з перевагами, використання великих даних також має свої недоліки:

  • Забезпечення конфіденційності та безпеки даних: Збір, зберігання і аналіз великого обсягу даних може ставити під загрозу конфіденційність та приватність особистої інформації. 
  • Витрати обробку даних: Обробка і зберігання великого обсягу даних може бути дорогим завданням, оскільки вимагає спеціалізованого обладнання та інфраструктури.
  • Стрес на інфраструктуру: Обробка великих обсягів даних може створювати значний трафік в мережі і накладати великі навантаження на інформаційні системи та інфраструктуру.
  • Низька якість даних: Великий обсяг даних може включати неповні, неправдиві або неправильно зібрані дані, що може призвести до неточностей і спотворення результатів аналізу.
  • Етичні питання: Використання великих обсягів даних може породжувати етичні проблеми, пов’язані з конфіденційністю, захистом особистих даних та потенційним використанням даних у шкідливий спосіб.

З одного боку, аналітика за допомогою методів керування великими даними дозволяє урядам розуміти потреби своїх громадян, налагодити роботу правоохоронних органів, оптимізувати систему транспорту та місцевого планування, мінімізувати системні помилки та покращувати роботу, зменшуючи витрати та поліпшуючи послуги будь-якої державної установи.

З іншого, одним із проблемних аспектів є співвідношення використання великих даних та прав людини. В Китаї система може ідентифікувати людину як уйгура, виявивши встановлений на мобільному телефоні додаток з уйгурським словником. А якщо уряд може відстежувати пересування своїх громадян, їх неважко контролювати. Уйгури у Китаї перебувають під суворим наглядом влади та піддаються репресіям.

Так, використання великих даних дійсно може принести значні переваги державному сектору, сприяючи поліпшенню результатів, які безпосередньо впливають на громадян. Проте, важливо пам’ятати, що ці інструменти також можуть потенційно завдати шкоди. Важливо проводити належний аналіз та нагляд за використанням великих даних, щоб забезпечити їхнє належне використання та запобігати можливим зловживанням.


Ця публікація розроблена ГО “ЙОДА” за підтримки Міжнародної фундації виборчих систем (IFES), Агентства США з міжнародного розвитку (USAID), Міністерства міжнародних справ Канади та британської допомоги від уряду Великої Британії. Будь-які думки, викладені у цій публікації, належать “ГО ЙОДА” і не обов’язково відображають погляди USAID, урядів США, Канади або Великої Британії.
Вам може сподобатись!

Перспективи інноваційної освіти в Україні

Мета сучасної освіти полягає у створенні умов для саморозвитку учнів та формуванні їхньої здатності приймати незалежні рішення. Досягнення цієї мети передбачає впровадження інновацій у систему освіти.