Andrey
Andrey
Делить точно не надо :)
Анатолий
Он прав?
Всё зависит от кодировки. Если utf8 или любая из старых кодировок - ничего делить и умножать не надо.
Если вдруг utf16 - то надо умножить на два. Но это если в книге спецсимволы из utf16, которых на клавиатуре вообще нет. Редко, но бывает такое :)
Анатолий
☕️ Паша ☭👨🏻🔧
utf8 больше 1251 в 2 раза
Нехис
Нет. Всего процентов 18 иероглифами и еще примерно столько же индийской письменности (если конечно предположить что все там хотя бы минимально грамотные)
Анатолий
Юникод - это просто стандарт. От его реализации зависит количество байт на символ. Есть utf-8, utf-16, даже utf-32
Aragaer
в utf-8 есть разница между "первым байтом" и continuation byte
Aragaer
по первому биту можно сказать является ли он первым байтом или же продолжением предыдущего символа
Aragaer
все аски в нем укладываются в один байт, а подавляющее большинство "не-иероглифов" - в два. Иероглифы - в 3-4.
Aragaer
А в utf-16 многие иероглифы укладываются в 2 байта, поэтому те, кому нужны иероглифы, любят utf-16
ARTi
Анатолий
Aragaer
а что именно надо посчитать?
Анатолий
Я вот зайду в блокнот, наберу текст, сохраню - он будет занимать 10 килобайт. Пересохраню в utf-32 - станет занимать 40 килобайт, тот же текст
Анатолий
Но utf-32 узкоспецифическая, её для вёрстки не используют :) Можно считать или байт на символ, или два байта если с иероглифами
Andrey
Если не знать кодировки
если не знать, какие символы используются. Как уже выше писали, символы в utf-8 могут занимать от 1 до 4 байт
Aragaer
плейнтекст или какой-нибудь формат документов?
Анатолий
Анатолий
Вообще нужна конкретика - какой текст, на каком языке
Andrey
наши в utf-8 2 байта. В cp1251 - 1
Andrey
Анатолий
Вот, всё зависит в какой кодировке сохранить. Блокнот по умолчанию сохраняет в 1251
Анатолий
Поэтому если будут сохранять в текстовик, то скорее всего это будет блокнот, 1251 и жёстко 1 байт на символ
Andrey
а мы же еще сжатие не учитывали! %)
☕️ Паша ☭👨🏻🔧
и зачем я всё расписывал раньше...
ARTi
ARTi
а для чего этот рассчет?
В статье написали что пришлось распечатать потому что электронная почта не может принять такой объем текста.
Andrey
а выложить куда-нибудь и послать ссылку?
Анатолий
ARTi
Анатолий
Анатолий
Понятное дело, он повесился, даже сраный блокнот на одном мегабайте уже подыхает
ARTi
Aragaer
да его любой архиватор сожмет в сотни раз
Анатолий
Это если отправить её чистым текстом, без сжатия :)
Анатолий
Что-то мутят
ARTi
Анатолий
Или действительно пытались скопировать и вставить текст прямо в окно почтового клиента
ARTi
Анатолий
Тогда конечно понятно, всё подохло :) Но это не называется "электронная почта не может принять такой объем текста". Это называется "мы не умеем пользоваться электронной почтой".
ARTi
Анатолий
Сколько страниц а4?
Зависит от того, насколько плотно набивать, каким кеглем, расстояние между строками, отступы с боков
Анатолий
ARTi
https://www.faz.net/aktuell/wirtschaft/unternehmen/lastwagen-mit-daimler-klage-erreicht-anwaelte-16252012.html
ARTi
В суд дело
Анатолий
Анатолий
Ну если прикинуть - 100 листов на сантиметр, то 650к получится стопка высотой 6 с половиной метров
Анатолий
Нормальное такое дело 😱
ARTi
ARTi
Как его читают и ищут там текст я без понятия
Анатолий
Сколько ж они его печатали... ))
Анатолий
Мне уже интересно, кто отважился набрать весь этот текст. Если 300 символов в минуту херачить - то получится надо 30 лет сидеть и набирать текст с учётом рабочего дня, сна и выходных.
ARTi
Анатолий
Считаем дальше :) 1.17 миллиардов знаков - примерно 1 гигабайт если в обычной кодировке. Если в utf-16 - то 2 гигабайта
Анатолий
Есть алгоритмы архивации, которые могут сжать 1 гигабайт текста до 25 мегабайт.
Анатолий
С двумя уже будет упс
Павел
Анатолий
Но! архиваторы умеют разбивать на томы. Можно отправить несколько архивов несколькими письмами
Анатолий
Тогда даже винрар на максимуме справится
Анатолий
И тогда нужно будет домножить на 200-300 примерно. Ну то есть получится пол терабайта текста, переведённого в картинки и зашифрованного в BASE-64 )
Анатолий
100 камазов текста
Анатолий
О! можно ж было весь текст закатать на болванки и перевезти не бумагу, а эти болванки
Анатолий
На одну! единственную болванку DVD-R.
Ну конечно с base-64 вышло бы 10 болванок, какое огорчение ))
ARTi
Анатолий
И если камазы забить не бумагами, а болванками, то скорость передачи данных заметно возрастёт ))
☕️ Паша ☭👨🏻🔧
Инструктаж
Сегодня на работе старый электрик учил молодого:
- Если силовой кабель лежит на земле, а ты не знаешь, под напругой он или нет, подходи медленно, широкими шагами.
- Учили ж маленькими.
- Маленькими это сваливать оттуда, когда тебя напруга врасплох застала, а приближаться надо широкими, чтобы раньше разницу потенциалов почуять, пока слабая. Если яйца задрожали и нос зачесался, ну, или наоборот, значит там тебе не рады, вот тогда вали мелкими и не отсвечивай.
Анатолий
Инструктаж
Сегодня на работе старый электрик учил молодого:
- Если силовой кабель лежит на земле, а ты не знаешь, под напругой он или нет, подходи медленно, широкими шагами.
- Учили ж маленькими.
- Маленькими это сваливать оттуда, когда тебя напруга врасплох застала, а приближаться надо широкими, чтобы раньше разницу потенциалов почуять, пока слабая. Если яйца задрожали и нос зачесался, ну, или наоборот, значит там тебе не рады, вот тогда вали мелкими и не отсвечивай.
А тестеры там, пиликалки всякие?
Анатолий
напряжённость поля измерить
☕️ Паша ☭👨🏻🔧
В теории есть наверное...
☕️ Паша ☭👨🏻🔧
я случайно оказался прав. только в теории и есть. есть патенты - но нет готовых (серийных) устройств. только прототипы.