Перейти к содержанию

Инфраструктура — Обзор

Серверы

Volta (основной сервер)

Параметр Значение
Железо Huananzhi F8D+, 2× Xeon (88 потоков), 128 GB RAM
GPU 2× V100 32 GB + NVLink 300G SXM2 (в сборке)
ОС Ubuntu 24.xx
Адрес 192.168.3.33
SSH ssh claude@192.168.3.33

SSH через локальную сеть

Всегда ssh claude@192.168.3.33 — не через AWG-туннель.

Сервисы:

tender-agent-claude.service   ← тендерный агент
mkdocs-wiki.service           ← эта вики
claude-tg-bot.service         ← Telegram-бот

DE Server (AWG-сервер)

Параметр Значение
Адрес 78.17.130.213 (Германия)
SSH root@78.17.130.213 — прямое подключение
Интерфейсы awg4, awg6 (443), awg7, awg8, awg9
microsocks 10.12.0.1:1080 через AWG-туннель

SSH для AWG-рестартов

Только root@78.17.130.213 напрямую, не через туннель 10.8.0.1 — иначе обрыв при рестарте AWG.

KZ Server

Выводится из работы

Вывод ~2026-06-23/24.

Бэкапы

Tier Назначение Хранилище
Tier-1 Критические данные Локально на Volta
Tier-2 Архивные бэкапы Яндекс Cloud Object Storage (restic)

Яндекс Cloud: юрлицо dn2dcnr2oru81bmbbln3

GPU / ML инфраструктура

NVLink 300G SXM2 kit состоит из:

  • 2× Internal adapter card (пассивные PCIe x16 — нет собственного чипа)
  • 4× SFF-8654 8i кабеля (2 на каждую карту → baseboard)
  • 1× 300G baseboard (SXM2 слоты для V100)

Почему expansion cards не видны в lspci

Они пассивные — просто транслируют PCIe сигналы. Реальные PCIe устройства — сами V100 (GV100). Видны только когда всё собрано и подключено.

Текущий статус: V100 в сервисе (замена термоинтерфейсов).
После возврата: собрать цепочку → перезагрузка → lspci | grep -i nvidia.