Чтобы хранить голос для 100 000 000 абнонентов полгода, надо примерно (15 минут *60 секунд в минуте *180 полгода*1689 байт в секунду *100000000 пользователей)/(1024.0*1024.0*1024.0) = 25 482 662 гигабайт. При стоимости хранения по минимуму 0.01-0.02$ за гигабайт(можно посмотреть на Amazon S3, это включает в себя стоимость обслуживания, серверов, электроэнергию персонала и т.д). Получается где-то 25 482 662* 0.01 = 254 826 в месяц, или 2.5 млр$ в год если хостится на Amazon.
Если посчитать по цене хранения самостоятельно, 1 Тб ~8 000 руб, или 25 482*8000 = ~211 млн, на примерно 8 жестких дисков то есть 8 Тб, нужен один сервер ~100 000 руб, получаем (25 482/8)*100 000 = ~318 млн руб (и примерно 3200 серверов). Потребление электроэнергии в год 6760 кило/ватт * 5 рублей за килло/ватт = 33 800 на один сервер или 33 800 *3200 = ~108 млн.
Таким образом получаем
капитальные расходы 500 млн минимум (+ строительство ЦОД + проектирование и т.д., коэфициент x2-x3, разработка софта),
то есть 1 млрд — 1.5 млрд рублей. Операционные расходы на электроэнергию 108 * x2(персонал и т.д) =
~200 млн рублей в год.
PS: дополнения по интернету, в законе написанно, что это будет дополнительно регулироваться постановлением правительства, думаю договорятся. по поводу расшифровки, если операторов связи прижмут то единственный вариант для них — «китайский» — заставят ставить свой сертификат, который бы позволял сделать атаку MitM, а весь шифрованный трафик без этого сертификата будут рубить.
PSS: если хранить весь интернет трафик полгода, то надо умножать все цифры на 1000 (12 Мбит/c), думаю на это вряд ли кто-то пойдет.
Админить сервисную ферму должен Аллах за бесплатно?
Это же все до сервера надо ещё и донести.
Или строить в каждом городе хранилища?
И да, не путайте файловую систему, которую они под себя разработали и железо, которое используется. А то скатимся до того, что все крутейшие конторы используют excel для видения фин отчётности, а на ERP (модули FI) системы.
На досуге прочтите, там не много…
1. циферку посмотрели сколько этих самых недорогих серверов?
2. у них и у нас понятие не дорогой сервер разнится примерно раза эдак в два, таможня и т.д. привет
3. задачи у них несколько другие, в отличие от нынешней ситуации
И это при том, что дата статьи оригинал 2007-й год.
Так, что не вариант сравнивать))
Кстати за 9 лет уже почти могло всё кардинально измениться, не находите?
В прочем я думаю вы как и nik тоже не прислушаетесь к голосу разума и не прочтёте, что я писал ранее, что этот закон шторка для порно «веливсегомугещего наконе»))))
ПС: Вы мне очень много интересных идей дали, благодарю вас пор человечески))
Currently there over 200 GFS clusters at Google. A cluster can have 1000 or even 5000 machines.
Что имеем?
Вольный перевод. Ни сказано, что это десктопы или сервера, понимайте как хотите.
Кстати другие крупные компании вроде Oracle, IBM, SAP, Microsoft и им подобные наверное совсем дурные раз имеют крупные дата центры с безумно большими объемами СХД?
Ещё раз повторюсь, что у Google свои задачи, не полностью ориентированные на хранение данных.
Давайте уже отделять мух от котлет, т.е. не будет все задачи сводить к одному и тому же решению.
techcrunch.com/2016/05/22/why-google-beat-yahoo-in-the-war-for-the-internet/
Блин горелый =)
Мы говорим про задачу хранения большого объема данных, я указываю в качестве инструмента использование дешевого железа с GFS, оперируя опытом гугла. Какие еще котлеты мы должны отделить от мух ?
Вы предложили в качестве решения задачи сервера HP и спросили, куда засунуть десктоп диск? Отвечаю — можно сделать как гугл, засунуть его в нищебродский сервер и накатить сверху GFS.
я тебе привожу конкретные решения для хранения и их цены. а ты вместо аргументированного ответа в стили «приведенное тобой хранилище за $100 не подходит по таким-то и таким-то техническим параметрам, которые обязательны для поставленной задачи, поэтому нужно купить хранилище за $10000 которое обладает необходимыми обязательными характеристиками» занимаешься тупым троллингом в стиле «приведенное тобой хранилище за $100 не подходит потому что с хранилища за $10000 можно получить больше откатов».
Вобщем я не имею привычки спорить с идиотами, поэтому прекращаю дискусию пока ты не купишь себе мозги.
во вторых, целесообраздность бекапа определеется из соотношении затрат на резервирование и стоимости ущерба в случаи потери данных помноженному на вероятность этой потери.
1. по закону нужно хранить не только голос, а весь интернет трафик. (нет смысла хранить только голос, если сейчас большинство пользуется скайп и прочими вайберами). А это уже объем в миллионы раз больше голосового трафика, т.е. того, что Вы рассчитали.
2. В связи с ростом скорости растет трафик в геометрической прогрессии. Т.е. то, что Вы рассичтали умножайте на сотни тысяч каждый год.
3. Хранение трафика в принципе бесполезно, т.к. есть сотни способов анонимного интернета, начиная от общественных точек wifi, sim-карт, оформленных на подставных лиц, незаконных подключениях к другим пользователям и т.д. и т.п.
уже нет. последние несколько лет в рашке инет в общественных местах раздают только по паспорту))
да и маразм не крепчал, маразм уже в сторонке плачет от таких дураков как в нашей госдуре
Борьба с терроризмом должна быть всесторонней!
иначе беда была бы уже давно.
Не хватает конкретики. Что за сервер за 100тр? Как обеспечивать отказоустойчивость дисков за 8тр? Эти диски хотя бы хотсвап поддерживают?
В смете не обнаружено автономное и резервное питание, системы безопасности, вентиляции, коммуникации (там одних цисок на вторую такую смету получается, если не больше), помещения для всего этого.
Фонд оплаты труда: сколько надо админов на 3200 сервера? по одному на 320 серверов? Сколько охраны? Это вообще немалое предприятие получается, там и работников других специальностей работа найдётся, ещё и менеджмент.
Это я еще не беру серверные желязяки, там интереснее…