timochka>> Майкрософт, Гугл, Амазон, Фейсбук ставят и обслуживают свои Линукс сервера сами. Никакой RedHat там рядом не лежал.
digger> Не знал, и вообще это секретно или нет что у них внутри? Т.е. просто скачивают апдейты или работают на лицензии GNU и вносят свой вклад?
Это коммерческая тайна, и соглашение, которое подписываешь при найме, прямо запрещает разглашать эту информацию.
Давайте я просто скажу, что и так известно, либо о компаниях в которых я не работал Ж-).
Обычно берут один из известных дистрибутивов и сильно его модифицируют. Сильно патчат ядро. Заменяют целые подсистемы: сеть, работа диском, свои файловые системы, менеджмент памяти, поддержку безопасных протоколов. Добавляют поддержку своего проприетарного железа. В любом датацентре куча виртуализации, и как правило проприетарной. Оптимизированные гипервизоры и прочее, прочее, прочее. Куча интерфейсов для удаленного контроля и управления. Многое из этого - закрытые решения от вендоров (того-же Интела).
Вообще мир производителей серверного железа, очень отличается от рынка "домашних" компьютеров. Поддержка этого железа часто требует софта, который ни в один стандартный дистрибутив не входит. Специальные версии firmware сделанные вендоров специально под тебя - не исключение, а правило.
Как только дело доходит до хранения банковских данных (кредитки в системах e-commerce), медицинских, или данных гос учреждений - нужна сертификация софта и шифрование всего и вся.
А значит даже обычну сборку Java не поставишь. Нужно искать поставшика сертифицированной безопасной Джавы. То-же с базами данных.
Из-за того, что масштаб компаний большой, все архитектуры выглядят странно. Они сильно масштабируемы. Очень сильно. 10 тыс серверов это маленький масштаб. Поэтому все стандартные системы типа: баз данных, балансировщиков нагрузки, распределенных координаторов, управления кластерами - все свои у каждой компании. mySQL - распределенный на сотни серверов, Zookeeper растянутый между континентами, балансировщик нагрузки на сотни миллионов одновременных соединений, распределенная файловая система на сотни тысяч серверов хранения данных - все эти штуки за пределами компаний первой сотни не используются. В опен сорс их выкатывать никто не собирается. В лучшем случае довольно абстрактную спецификацию на конференции презентуют.
Обратно в опен сорс контрибутят, но сильно не все и очень не сразу. Гугл публикует whitepapers и исходники своих систем когда контора переходит на следущее поколение/архитектуру.
Лицензии это все вполне позволяют. И с легальной стороны там все чисто. Legal department всех периодически сно...имеет на тему соблюдения всего и вся. Даже просто так взять открытую софтину и поставить обычно нельзя. Сначала нужно разрешение получить. А уж в Production ее выкатить - есть специальная процедура.