Организация иерархии папок с записанным материалом
Каждая организация вырабатывает свои принципы хранения цифрового материала, что обусловлено отсутствием единого стандарта. Отсутствие единого стандарта не является какой-то особенной проблемой при условии того, что такой стандарт выработан внутри организации, и ему неукоснительно следуют. Проблемой как раз является отсутствие системы. При объединении разнородных архивов, полученных от разных собирателей и организаций, в какой-то момент возникает ситуация, когда в материалах могут разобраться один или два человека, что сильно затрудняет какую-либо работу с фондом. Данная тема больше относится уже не к первичной обработке материала, а непосредственно к работе с фондом, но некоторые аспекты этой проблемы связаны напрямую именно с первичной обработкой.
Исторически в ходе экспедиционных поездок фиксировался разный материал, например, только аудиозаписи, что было естественно для этномузыкологов в эпоху аналоговой записи; аудио и фото; аудиозаписи и рукописные материалы. В рамках физического хранения аналоговых носителей было логично объединять хранение материалов по типу: кассеты с кассетами, бобины с бобинами, плёнки с плёнками, тетради с тетрадями и так далее. К сожалению, во многих организациях это принцип сохранился и при организации древа каталогов хранения цифровых материалов.
В результате видео-, фото- и аудиоматериалы одной экспедиции и одного сеанса записи могут храниться на разных жёстких дисках, что не очень рационально для работы с фондами. Речь здесь не идёт о тех случаях, когда для определённого типа материала используется специальная программа. Например, для фотографий организовано хранение при помощи Google Picasa, а для аудио- и видеозаписей используется медиаплеер Itunes. Такой принцип, возможно, будет затруднительно соблюдать для оцифрованных бобин или аудио- и видеокассет, где на одном файле с оцифрованной бобины могут находиться материалы разных сеансов записи и даже разных экспедиций. Принцип хранения всех материалов сеанса записи в одной директории, в первую очередь, больше подходит, и даже необходим для базового хранения исходников, полученных в ходе экспедиций, где запись велась на цифровую аппаратуру.
В Центре русского фольклора выработан следующий принцип организации древа каталогов:
Все материалы сеанса записи сохраняются в директорию, название которой формируется исходя их даты проведения сеанса «2019.06.21», кодового номера региона, в котором был проведён сеанс «61» (Ростовская область), аббревиатуры организации или нескольких организаций «CRF-RAM-SCRTK» (Центр русского фольклора, Российская академия музыки имени Гнесиных, Самарский центр русской традиционной культуры), источник поступления материала «E» (экспедиция), сокращённое название района и название населённого пункта «Bkv-Il'in» (Боковский район, хутор Ильин).
Внутри этой директории создаются поддиректории для каждого типа материалов с таким же названием и добавлением индекса типа материала: «A» — аудио, «F» — фото, «V» — видео, «R» — реестр. Каждая папка отвечает за данные записанные с одного из устройств. Если запись велась на несколько рекордеров, то для каждого из них создаётся отдельная папка с присвоением номера A1, A2. Файлы внутри этих поддиректорий переименовываются с добавлением индекса и порядкового номера «V1», «V2» (видео №1, видео №2) и так далее.
Главная идея заключается в том, чтобы в имени файла можно было увидеть всю информацию отображенную в вышестоящей иерархии папок. Глядя на файл мы можем понять, кем, когда и где и в какой из сеансов записи он был создан.
Имена файлов должна содержать нули перед номером. 001, 002, 003. Это связано с тем, что операционные системы производят сортировку по первому знаку. Если у вас в папке 15 файлов именованные как 1, 2, 3,....11, 23, 13, то при сортировке после 1 будет идти 11. Для этого надо примерно понимать какой количество файлов в папке и выставлять соотвествующее количество нулей.
Несмотря на то, что все современные системы поддерживают юникод, и проблем с кириллическим названием директорий и файлов уже практически не возникает, тем не менее было принято решение все названия файлов писать латиницей. Это может уберечь от проблем при дальнейшей работе, например при написании служебных скриптов на различных языках программирования или добавлении директорий с файлами в какую-либо программу учёта, которая не гарантированно поддерживает корректную работу с кириллическими шрифтами.
I уровень — экспедиция
2014-GRCRF-34-E-Volgogradskaya — директория
II уровень — сеанс записи
02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1
02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-2
III уровень — тип материала (аудио, видео, фото)
02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-A
02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-V
02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-F
IV уровень — учетная единица (название файла)
...-1-A\02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-A-01.wav
...-1-V\02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-V-01.mp4
...-1-F\02.10.2014-34-GRCRF-E-Alk-Alekseevskaya-1-F-0001.jpg
Таблица источников материала
E — экспедиция
L — коллекция частных лиц
К — концерты, фестивали
R — радио, телевидение
U — коллекции учреждений
S — студийные записи
Таблица индексов типов материала
А — аудиоматериалы
KA — многоканальная запись
R — рукописные заметки собирателя (реестр)
F — фотографии
FК — фотокопии
V — видео
VК — видеокопии