Нешенновские алгоритмы сжатия или суперархивация, бред или возможность?

Пару лет я занимаюсь тем, что многие посчитают бессмысленным занятием - изучение сверхсжатия данных. Казалось бы, теория Шеннона давно поставила точку в этом вопросе и люди, страдающие подобными идеями глупцы. Однако, есть интересные выкладки, которые могут заинтересовать скептиков по данному вопросу.

Все современные алгоритмы сжатия используют принцип устранения избыточности информации ака уменьшение энтропии собщения и являются вычислимой по Тьюрингу функциями. Используя данный подход, неизбежно упираешься в теоретический предел сжатия информации, который разочаровывает всех соискателей суперархивации.

Ну, а что если предложить другие методы сжатия? Например те, которые представляют собой NP задачи, требуют большого количества энергии на решение, но обеспечивают сжатие боле чем в тысячу раз ? (Например, сжатие 1Гб до 1Мб) .

Например, поиск наименьшего математического выражения, вычисля которое получается исходная информация. К примеру, такое x = 999999999^999999999 (число, полученное в итоге занимает 3, 5 Гб памяти) или вот такое x = (10^9 ! ) !

Если разобраться, чисто теоретически можно сжать 2^2^20 различных вариантов информации весом в 1Гб до 1Мб. Это комбинаторное ограничение
5 года назад от Павел Орлов

2 Ответы

0 голосов
Предположим, будем искать выражение только одним способом, например, в виде m^n. Тогда мы не сможем одинаково равномерно сжать все числа в заданном диапазоне. Например, простые числа при таком представлении только удлиняются. Хотя в отдельных случаях сжатие будет колоссальным, это будет достигнуто за счёт слабого сжатия в других случаях и удлинения в третьих случаях.

Если же использовать различные формулы с целью перекрыть весь диапазон чисел, то с каждым числом придётся передавать код формулы, что губит всю идею.
"Больших семь шапок из овцы не выкроишь никак".

Если интересна эта тема, копайте лучше в сторону осмысленности информации. Например, большинство гласных в тексте можно убрать и получатель сможет этот текст восстановить.
5 года назад от Алекс Бабаков
0 голосов
в 2012 году срочно понадобилось с заполярья передать информацию в исходнике - ЛИС формате 600 мбайт по спутниковому. ЛИС (лабораторный измерительный формат) изначально предельно сжатый, не одна программа боле чем на 10% его не сжимает. С той скоростью которая в те годы для заполярья была доступна 1, 2 мбайт в час, передать его было нереально. Но мой программист выкрутился и сжал в 60 раз. Через месяц он уже стал работать в закрытой системе.
5 года назад от ValKo

Связанные вопросы