Perma.cc — Википедия

Perma.cc
Perma.cc
Изображение логотипа
URL perma.cc
Коммерческий Нет
Тип сайта Веб-архив
Язык (-и) Английский
Начало работы 2013 год
Текущий статус работает

Perma.cc (Perma) — некоммерческий сервис по архивированию интернет-источников, цитируемых в научных работах и в области правосудия. Портал был создан в 2013 году в рамках сотрудничества между Library Innovation Lab и библиотекой Гарвардской школы права. Предпосылкой создания Perma.cc послужило проведённое профессорами юридического факультета Гарвардского университета исследование вымирания ссылок в документах правовой сферы. Оно показало, что более 50 % используемых в судебных решениях электронных ссылок больше не ведут на исходный материал. Для научных журналов аналогичный показатель составил более 60 %.

Perma.cc архивирует документы и осуществляет дальнейшее долгосрочное хранение архивированных материалов в партнёрстве с широкой сетью институциональных партнёров, каждый из которых имеет доступ к зеркалам базы данных. К 2019 году на портале было зарегистрировано около 25 000 пользователей, которые заархивировали более 1 млн ссылок. На 2022 год в сеть Perma.сс входили более 150 учреждений, в том числе Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета», «Цифровая публичная библиотека Америки», Библиотека Конгресса, Министерство юстиции США, а также суды штатов Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана и других.

Сервис Perma.cc был создан в 2013 году в рамках сотрудничества библиотеки Гарвардской школы права и Library Innovation Lab[1][2]. Предпосылкой для его создания стало проведённое профессорами юридического факультета Гарвардского университета исследование распространённости вымирания ссылок в области юриспруденции. Авторы проанализировали судебные решения Верховного суда США и статьи трёх основных юридических журналов Гарвардского университета — Harvard Law Review[англ.] (HLR), Harvard Journal of Law & Technology[англ.] (HJLT) и Harvard Human Rights Journal (HRJ). Согласно результатам исследования, более 50 % ссылок в судебных решениях и более 60 % ссылок в научных статьях больше не вели на исходный материал[3][4][1][3]. Исследование согласовало результаты проводимого ранее анализа решений Верховного суда США за 2009—2010 год, согласно которому 29 % цитируемых онлайн-материалов перестали быть доступными[3][5][6].

Авторы опубликованного исследования — Джонатан Зиттрейн[англ.], Лоуренс Лессиг и Кендра Альберт — предложили учёным и специалистам в сфере юриспруденции архивировать цитируемые веб-страницы и, таким образом, предотвратить вымирание ссылок. Решить поставленную задачу был призван сервис Perma.cc или Perma, над созданием которого работали исследователи Гарвардского университета и разработчики ПО. Ведущим исполнителем проекта стал Мэтт Филлипс[1][2]. В обсуждении Perma.cc принимали участие представители более шестидесяти библиотек юридических факультетов, а также Центра Беркмана по изучению Интернета и общества[англ.], «Архива Интернета» и «Цифровой публичной библиотеки Америки»[7][8][1]. Проект был задуман как некоммерческий, с финансированием за счёт бюджетов партнёрских библиотек и грантов[9][10].

Perma.cc обеспечивает долгосрочное хранение архивированных материалов благодаря широкой сети институциональных партнёров, каждый из которых воспроизводит и пополняет зеркало основной базы данных[1]. На момент запуска у Perma.cc были заключены соглашения с 26 научными учреждениями и некоммерческими организациями, включая Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета» и «Цифровую публичную библиотеку Америки». Спустя два года после запуска коллекция Perma.cc включала более 104 тыс. заархивированных страниц[11], а количество партнёрских организаций увеличилось до 90[12][6]. К 2019 году на портале зарегистрировались около 25 000 пользователей, которые в общей сложности заархивировали более 1 млн ссылок[2]. На 2022 год в сеть Perma.сс входили более 150 учреждений[13], включая Библиотеку Конгресса, Министерство юстиции США, суды штата Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана[14][6].

В 2015 году сервис стал победителем международной профессиональной интернет-премии Webby Awards и получил награду как лучший веб-проект в области права[15][16].

В 2016 году Институт музейного и библиотечного обслуживания США[англ.] выделил Гарвардской Library Innovation Lab грант размером 700 000 долларов США на расширение деятельности сервиса на все области науки[17][18]. Средства были вложены в техническое сопровождение расширения базы пользователей, работу по внедрению Perma.cc в национальные академические библиотеки, а также на разработку системы коммерческих подписок[19].

В августе 2021 года портал подвергся критике за несовершенную систему хранения материалов — опубликованное в New Scientist исследование 16 627 статей, заархивированных 17 европейскими и американскими организациями, показало, что некоторые генерируемые Perma.cc ссылки больше не работают[20][21].

Принцип работы

[править | править код]

Для научных учреждений, журналов и судов доступ к Perma.сс предоставляется бесплатно. Организации-члены могут зарегистрировать для своих сотрудников неограниченное количество учётных записей с безлимитным доступом к архивации веб-материалов[22][14][23][5]. Для каждого члена сети Perma.cc создаётся отдельное пространство, где все аффилированные с организацией пользователи могут совместно работать[24]. В 2017-м портал добавил возможность создания бесплатных учётных записей с возможностью сохранения 10 веб-страниц ежемесячно, а также внедрил систему коммерческих подписок для не связанных с наукой или судебной системой учреждений (таких как частные юридические фирмы)[22][10][25][26][6][27]. С 2019 года лимит ссылок на архивацию для бесплатных учётных записей был ограничен десятью, без возможности продления ежемесячной подписки[28].

В отличие от другого крупного сервиса веб-архивирования — Wayback Machine — Perma.cc не использует поисковых роботов для сохранения интернет-страниц, пользователи сервиса самостоятельно архивируют необходимые источники. После получения запроса на архивацию Perma.cc добавляет веб-страницу в формате WARC[англ.] в хостинг Amazon S3. Через несколько секунд после этого копия файла WARC автоматически сохраняется на расположенный в Германии сервер[29][14][6]. Архивированные версии веб-страниц содержат дополнительные метаданные, такие как время и дата архивации[24]. Также Perma.cc сохраняет список архиваций каждой отдельной учётной записи[30].

В результате пользователи получают так называемую perma link — постоянную ссылку на исходный материал, действующую даже в том случае, если первоисточник был удалён[31][22][32][33]. Перейдя по perma link пользователь получает доступ к снимку экрана в формате PNG, сделанному в момент архивирования страницы, а также к сохранённой HTML-версии страницы[11][9]. Впоследствии авторы могут использовать данную ссылку в цитировании, вставляя её либо вместо оригинального URL-адреса, либо в дополнении к нему[31][24][34].

Большинство заархивированных через Perma.cc документов находится в открытом доступе[24]. Сервис не архивирует защищённые пейволлом материалы. Например, при попытке создать perma link на статью в The Wall Street Journal пользователь увидит баннер с просьбой приобрести подписку, а не текст статьи[1]. Однако у сервиса есть и так называемый dark archive («тёмный архив») — коллекция архивированных сайтов, закрытых от публичного доступа по желанию пользователей. Туда сохраняются и веб-страницы, владельцы которых включили в код сайта стандарт исключений для роботов. Для получения доступа к таким материалам пользователь может оставить запрос через любую партнёрскую организацию[11][8][35].

Perma.cc не несёт ответственности за содержание архивируемых материалов. Согласно правилам сервиса, пользователи могут использовать коллекцию Perma.cc только для некоммерческих целей, не нарушающих чьи-либо авторские и другие права[22].

Примечания

[править | править код]
  1. 1 2 3 4 5 6 Ian Chant. Perma.cc Aims to Bring Staying Power to Online Legal Citations. Library Journal (2 октября 2013). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
  2. 1 2 3 Pausing the Internet. The Practice (март 2019). Дата обращения: 15 ноября 2021. Архивировано 1 декабря 2021 года.
  3. 1 2 3 Flyntz, 2015, с. 39—59.
  4. Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere. The New York Times (23 сентября 2013). Дата обращения: 10 ноября 2021. Архивировано 20 октября 2021 года.
  5. 1 2 Евгения Ударцева. Вечная жизнь для ссылок. Nag News (18 октября 2010). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  6. 1 2 3 4 5 Stanton, 2019, с. 14—15.
  7. Jill Lepore. The Cobweb. New Yorker (19 января 2015). Дата обращения: 12 ноября 2021. Архивировано 25 января 2015 года.
  8. 1 2 Jefrey Perkel. The Trouble with Reference Rot. Nature. Дата обращения: 13 ноября 2021. Архивировано 3 декабря 2021 года.
  9. 1 2 Flyntz, 2015, с. 39=59.
  10. 1 2 Death To “Link Rot”: Here’s Where The Internet Goes To Live Forever. Fast Company (28 марта 2014). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  11. 1 2 3 Jonathan Zittrain: Fighting ‘link rot’ in court opinions and legal scholarship. ABA Journal (24 сентября 2014). Дата обращения: 16 ноября 2021. Архивировано 3 декабря 2021 года.
  12. Aaron Gustafson. Avoiding Link Rot in Print with the Help of Perma.cc. Medium (3 декабря 2015). Дата обращения: 13 ноября 2021. Архивировано 24 ноября 2021 года.
  13. About. Perma.cc. Дата обращения: 17 ноября 2021. Архивировано 17 ноября 2021 года.
  14. 1 2 3 Probst, 2020, с. 35—59.
  15. Meg Kribble. Congrats to the Webby Award-winning Perma.cc! HLSL. Дата обращения: 8 ноября 2021. Архивировано 3 декабря 2021 года.
  16. Webby Awards, Winners 2015. Webby Awards. Дата обращения: 17 ноября 2021. Архивировано 23 июня 2020 года.
  17. Harvard’s Perma.cc receives grant to expand its tools for saving sources on the Web. Harvard Law Today (14 апреля 2016). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
  18. Leif Johnson. The Million Dollar Homepage is a Million Dollar Graveyard. Vice (24 июля 2017). Дата обращения: 11 ноября 2021. Архивировано 3 декабря 2021 года.
  19. Dulin, 2017.
  20. Chris Stokel-Walker. Digital archives meant to be permanent seem to be lost on the web. New Scientist (30 августа 2021). Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
  21. Веб-архивы не гарантируют сохранности данных — американские ученые. Красная Весна. Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
  22. 1 2 3 4 Callister, 2021, с. 1—57.
  23. Lepore, 2015.
  24. 1 2 3 4 Zittrain, 2014, с. 165—188.
  25. Jacob Kastrenakes. Supreme Court citations are falling apart as web links begin to change and disappear. The Verge (23 сентября 2013). Дата обращения: 13 ноября 2021. Архивировано 23 ноября 2021 года.
  26. About. Perma.cc. Дата обращения: 16 ноября 2021. Архивировано 24 ноября 2021 года.
  27. How should we guard against link rot? Thomas Whitley (13 марта 2015). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  28. Introducing Individual Account Subscription Tiers for Perma. Harvard Blogs (7 января 2019). Дата обращения: 10 ноября 2021. Архивировано 28 октября 2021 года.
  29. Ben Steinberg. Library Innovation Lab. Дата обращения: 17 ноября 2021. Архивировано 3 декабря 2021 года.
  30. Joseph Cox. Motherboard Made a Tool That Archives Websites on Demand. Vice (1 мая 2018). Дата обращения: 6 ноября 2021. Архивировано 3 декабря 2021 года.
  31. 1 2 Riss, 2015, с. 1251—1252.
  32. Новый сервис сделает интернет-ссылки «вечными». Lenta.ru (16 октября 2013). Дата обращения: 15 ноября 2021. Архивировано 4 декабря 2021 года.
  33. Библиотекари США разработали новый сервис, который позволит создавать "вечные" интернет-ссылки. Фокус (17 октября 2013). Дата обращения: 18 ноября 2021. Архивировано 4 декабря 2021 года.
  34. Craigle, 2021.
  35. Craigle, 2021, с. 1—13.

Литература

[править | править код]
  • Callister P.G. Perma.cc and Web Archival Dissonance with Copyright Law // Legal Reference Services Quarterly. — 2021. — Т. 40, вып. 1. — С. 1—57. — doi:10.1080/0270319X.2021.1886785.
  • Craigle V. Adopting DOI in Legal Citation: A Roadmap for the Legal Academy // Virtual Symposium on Citation and the Law, University of Utah College of Law Research Paper. — 2021. — С. 1—13.
  • Dulin K., Ziegler A. Scaling Up Perma.cc: Ensuring the Integrity of the Digital Scholarly Record // D-Lib Magazine. — 2017. — Т. 23, вып. 6. — doi:10.1045/may2017-dulin.
  • Flyntz M. Ever Onward: Expanding the Use of Perma.cc // Legal Reference Services Quarterly. — 2015. — Т. 34, вып. 1. — С. 39—59.
  • Gertler A., Bullock J. Reference Rot: An Emerging Threat to Transparency in Political Science // American Political Science Association. — 2017. — С. 166—171.
  • Klein M., Sompel H., Sanderson R., Shankar H., Balakireva L., Zhou K., Tobin R. Scholarly Context Not Found: One in Five Articles Suffers from Reference Rot // PLoS One. — 2014. — Т. 9, вып. 12. — doi:10.1371/journal.pone.0115253.
  • Lepore J. The Cobweb // Annals of Technology. — 2015. — С. 1—13.
  • Probst S. Available At?: The Tenuous Nature of Online Authority Cited in Arkansas Judicial Opinion // Arkansas Law Notes. — 2020. — Вып. 35. — С. 25—39.
  • Riss P. Reference rot: does it matter? // Int Urogynecol J. — 2015. — Вып. 26. — С. 1251—1252. — doi:10.1007/s00192-015-2707-8.
  • Stanton C. Perma and Citation at the Modern Law Firm // Michigan Bar Journal. — 2019. — С. 14—15.
  • Zittrain J., Albert K., Lawrence Lessig L. Perma: scoping and addressing the problem of link and reference rot in legal citations // Harvard Law Review Forum. — 2014. — Т. 125, вып. 165. — С. 165—188.