Від наночастинок до ДНК: де зберігати дані, що переживуть людство
Ми досі можемо прочитати єгипетські ієрогліфи, клинопис шумерів та написи на стінах Софійського собору. А ось вчорашні бекапи табличок Excel, відеокасети з нашого дитинства та бази клієнтів світових компаній можуть безслідно зникнути в один момент: носій зламається, формат застаріє, дані зітруться.
Вже через три місяці з моменту запису 85-90% даних стають холодними — тобто такими, які рідко використовують та змінюють. Часто це медичні дослідження, фінансові документи, відеоархіви, резервні копії, історичні колекції тощо — вони не потрібні щодня, але їх не можна просто видалити. І кількість цих даних стає дедалі більшою.
Тож людство, прагнучи зберегти величезний обсяг інформації для майбутніх поколінь, починає вигадувати нові носії, які будуть компактніші та витриваліші. Хочу розповісти про деякі з цих проєктів.
У склі
Мабуть, одна з найвідоміших сучасних ініціатив — Project Silica від Microsoft. Вона використовує фемтосекундний лазер, схожий на ті, якими роблять лазерну корекцію зору та виготовляють мікросхеми. Ним дуже швидко, за одну квадрильйонну частину секунди, випалюють текст імпульсами всередині скла, утворюючи об’ємні пікселі.
Імпульси лазера настільки швидкі, що можуть точково змінювати структуру скла зсередини, не перегріваючи й не пошкоджуючи матеріал навколо. Стійкість носія також зумовлює діоксид кремнію, з якого він зроблений — він входить до складу більшості видів скла, утворюється з земної кори та в природі часто буває у вигляді гірського кришталю.
В одному скляному носії розміром зі звичайний DVD-диск може вміститися до 7 терабайтів. Дані не зітруться сотні тисяч років, адже є стійкими до впливу води, вогню, подряпин та електромагнітного поля. До 2035 року планується масово застосовувати технологію в датацентрах та представити для масового користувача СЗД з більш доступного боросилікатного скла.
Для зчитування інформації з носія використовують автоматизований мікроскоп із камерою, який знімає шари всередині скла та бачить ці мікроскопічні заглиблення. Далі система декодує зображення назад у біти, використовуючи машинне навчання, яке допомагає правильно розпізнати сигнали, шум і взаємний вплив сусідніх точок.
Схожий проєкт — 5D Memory Crystal від SPhotonix, який використовує ті ж лазери і принципи, але трохи міцніший матеріал і довший процес запису. Дані кодуються у п’яти вимірах (трьох просторових координатах і двох оптичних параметрах), а невеликий носій до 13 см може розмістити 360 Тб та зберегтися до 14 мільярдів років. Цей пристрій ви вже могли бачити в фільмі «Місія неможлива 8: Фінальна розплата»:
У кераміці
Підписуйтеся на наші соцмережі
Проєкт Cerabyte стверджує, що кераміка може протриматися понад 5000 років, витримати температуру нижче за -273 °C і понад 500 °С, радіоактивне випромінювання, кип’ячіння в солоній воді та інші екстремальні випробування.
Саме тому для збереження даних компанія використовує випалювання лазером закодованої інформації на шарах кераміки поверх скла товщиною в 100 мікронів. Окремі скляні пластини розміром 9,4 на 9,4 см складаються в картриджі, щоб їх легше було інтегрувати в датацентри. Такі картриджі дуже легко зчитуються завдяки високому контрасту між нанесеними темною керамікою бітами інформації товщиною в 100 атомів та склом.
Коли треба витягнути інформацію, система бере потрібну пластину, наводить оптику на ділянку і робить дуже швидкі знімки поверхні, приблизно 500 кадрів у секунду, а потім декодує отримані зображення назад у цифрові біти. За це відповідає паралельна обробка на спеціалізованому чипі (FPGA), який швидко розпізнає патерни і відновлює початкові файли.
Співзасновник Cerabyte Мартін Кунзе вже давно використовує кераміку і в іншому своєму проєкті Memory of Mankind. У ньому текст 1000 книжок сильно зменшують (5 рядків на 1 мм) та наносять на керамічні пластини розміром 20×20 см, які можуть вмістити до 5 мільйонів символів (приблизно 5 книжок по 400 сторінок). Архів із пластин розміщують на глибині 2 км у соляному родовищі під горою Плассен в Австрії, і така капсула часу може витримати тиск льодовиків та екстремальних температур.
У голограмах
Британський проєкт HoloMem прагне почати записувати дані на полімерній стрічці у вигляді мікроголограм. Компанія планує запустити систему зберігання даних HoloDrive як комерційний продукт вже в 2027 році.
В основі технології знаходиться тонкий (до 16 мікронів) світлочутливий полімер, схожий на матеріал, який застосовують в HUD дисплеях для автомобілів. На нього світять лазером, що змінює хімічний стан матеріалу. Далі цей полімер вкладають між двома шарами PET-плівки, щоб отримати міцну гнучку стрічку для картриджа.
Таку голографічну стрічку можна буде зчитувати вже наявними ресурсами для обробки LTO (магнітних стрічок), тож не доведеться витрачатися на зміну всього обладнання датацентрів та архівів. До того ж стартап обіцяє використовувати дешеві елементи, наприклад лазерні діоди усього за $5; сумарно ТСО буде нижча на 20% від найсучасніших моделей LTO, а термін зносу ресурсів складатиме 50 років.
В ДНК
Двійкова система в ДНК кодується за допомогою таких нуклеотидів — аденін (A), гуанін (G), цитозин (C) і тимін (Т). Наприклад, визначається, що поєднання 00 – це А, 01 – С, 10 – G, а 11 – T. Потім комбінація цих послідовностей утворюється в молекулу, яку зберігають в капсулі з інертним газом. Щоб закріпити нуклеотиди на своїх місцях, між ними додають спеціальні хімічні блокери, і таким чином можна згрупувати послідовність з 200-300 елементів.
Коли ці дані потрібно прочитати, застосовується секвенування. Воно може відбуватися за допомогою світла, зміни кислотності, електричного сигналу або іншим зручним методом.
Розробкою методики займається DNA Data Storage Alliance, створений за ініціативи компаній Illumina, Microsoft, Twist Bioscience та Western Digital. Поки що головною перешкодою для масового використання цього способу зберігання даних є ціна. Секвентнування ДНК наразі коштує до $200 за 1 ГБ, найближчими роками прогнозується падіння ціни до $130 за 1 Гб.
На нікелі
Пам’ятаєте Розетський камінь, завдяки якому вченим вдалося розшифрувати єгипетські ієрогліфи? На ньому єгипетські жерці адресували подяку одному з царів, записавши ідентичний за сенсом текст єгипетською та давньогрецькою, що і дозволило співставити словами та дослідити невідому нам мову.
Схожий принцип для збереження мов створили Long Now Foundation. Вони представили диск розміром 7,6 см, на якому у вигляді дрібних зображень розташовані приблизно 13500 сторінок з уривками з Книги Буття на 1500 мовах. Усі тексти можна побачити через мікроскоп зі збільшенням у приблизно 650-750 разів.
Матеріал для диску визначили ще у 1998 році — нікель. Зображення текстів спершу витравили на кремнієвій матриці, на якій потім провели осадження металу з електроліту під дією електричного струму (гальванопластика). Інший бік диску з інструкцією до використання 8 мовами створили шляхом витравлення шару оксидного покриття на титані.
Компанія випустила також варіант Розетського диску, який можна носити як прикрасу за пожертвування ініціативі у розмірі $1000.
Нікель також використовує компанія Arch Mission Foundation, яка прагне зберегти інформацію навіть за умов, що людство зіткнеться з катаклізмами і Земля стане непридатною для життя. Для цього, зокрема, було розроблено нанофіші (Nanofiche) — нікелеві пластини, на яких дані наносяться дрібним шрифтом. З них уже складають архів, який має зберігатися в космосі, Arch Lunar Library. Нікель обрали через те, що він не так сильно окислюється, як інші метали, на нього не впливає радіація чи дія мікробів, а також він стійкий до екстремальних температур. Дрібне нанесення лазером з довжиною хвилі в 10 наномікрон дозволяє нанести 2000 сторінок тексту на 1 см².
Що далі?
Вже згаданий мною Arch Mission Foundation також створює архіви усередині вулкану на Гаваях, робить записи в ДНК та в 5D кристалах пам’яті, а скоро ще й планує анонсувати синтетичний аналог бурштину, де можна буде зберігати біологічний матеріал. Дедалі більше чути про збереження даних в кількох або й узагалі в одному атомі.
Носії передбачувано ставатимуть все меншими, але до єдиного ідеального зразка ми навряд чи дійдемо. Для швидкого доступу потрібні одні технології, для бізнес-бекапів — інші, для архівів на століття — щось радикально міцне і захищене від катастроф. І, можливо, колись ми взагалі повернемося до початку історії, де надійними будуть не обов’язково найсучасніші носії, а ті, які можна прочитати, навіть коли навколо вже немає жодних цифрових програм, серверів і форматів.
А поки людство вигадує, як передати інформацію майбутнім цивілізаціям, бізнесу варто подбати про значно ближче майбутнє та зберегти свої дані вже зараз. Хмарне сховище допоможе організувати надійне зберігання даних та бекапів без зайвих витрат на власну інфраструктуру.