QLogic QLE 8142 - BIOS kaputt


#1

Moin,

wir haben mittlerweile für Freifunk Nordwest auch einen Server bei IN-Berlin stehen. Der Server wurde mit einer QLogic QLE 8142 für die Anbindung ans Comminity-IX ausgestattet, seit seiner Reise nach Berlin ist das BIOS der Karte jedoch kaputt https://p.rrbone.net/paste/3dCTTipa#Na84y-LVEAocy8/rB/3BdRSO3785a1o1YrTIhlgV+TW

Die Karte kann FCoE sowie Ethernet und war mit 2 Devices unter lspci vertreten, nun fehlt das Ethernet-Device mitsamt den Interfaces enp1s0f0 und enp1s0f1.

Ein Flashen des BIOS unter FreeDOS schlug auch fehl, da das NVRAM invalid data enthält.

Hat jemand der Serverhardwarebewanderten hier eine Idee, was wir noch machen können (außer die Berliner zu fragen, ob sie noch eine Mellanox-Karte übrig haben?)?

vg
bjo


#2

Es wird ja scheinbar versucht die Firmware direkt zu laden aber das File ist nicht vorhanden.

  [  1.110290] qla2xxx 0000:01:00.0: firmware: failed to load ql8100_fw.bin (-2)
  [  1.110336] qla2xxx 0000:01:00.0: Direct firmware load for ql8100_fw.bin failed with error -2
  [  1.110338] qla2xxx [0000:01:00.0]-0091:0: Firmware images can be retrieved from: http://ldriver.qlogic.com/firmware/.

Habt ihr die passende Datei mal unter /lib/firmware/ abgelegt?
Ansonsten könntest du noch ein Flash der Firmware vom OS mit dem SANSurfer versuchen.

Viele Grüße,
Lars


#3

Es gibt nirgends die Datei - also weder hier http://ldriver.qlogic.com/firmware/ noch in firmware-qlogic, und die Karte funktionierte ja noch, als der Server hier zur Einrichtung stand.

Für die Ethernet-Interfaces wurde sonst das qle-Modul geladen, das findet nun nichts. Auch beim Booten taucht das BIOS nicht mehr auf.


#4

Korrigiere mich wenn ich falsch liege, aber hier gibt es doch alles:

http://driverdownloads.qlogic.com/QLogicDriverDownloads_UI/SearchByProductOEM.aspx?oemid=65&oemcatid=135936&productid=1104&os=190

Die Firmware ist im “Multi-boot Image for 8100 Series” (q8q20312.bin).

Einfach umbenennen und nach /lib/firmware/ legen, würde ich vermuten.


#5

Sicher hat schon jemand nachgesehen, ob nach dem Transport noch alles im Steckplatz ist wie vorgesehen?


#6

Das Flashen des Multiboot-Images schlug fehl, laut https://pve.proxmox.com/pipermail/pve-devel/2011-December/002204.html bspw hat die Karte die Firmware selbst und muss nicht als Datei vorliegen:

# not needed, the HBA has burned-in firmware
'ql8100_fw.bin' => 1

Die Datei nach /lib/firmware zu werfen hilft leider auch nix.


#7

Hast du den zweiten Vorschlag auch schon versucht? Wenn der SANSurfer (bzw. neuer Name QConvergeConsole) die Karte erkennt hat er eine Option das NVRAM auf die Factory Defaults zurückzusetzen.


#8

Kernel Modul qla2xxx.ko ist geladen der?


#9

@Tarnatos

[  1.110290] qla2xxx 0000:01:00.0: firmware: failed to load ql8100_fw.bin (-2) 

Ne :stuck_out_tongue: Wobei das Modul für den Ethernet-Teil eh qle wäre - welches aber nichts mehr findet.

@Lars
Das haben wir nicht mehr weiter ausprobiert, sondern die Karte durch eine HP NC552SFP aka Emulex Corporation OneConnect 10Gb NIC (be3) ersetzt.

Läuft auch ansich, allerdings haut die Karte von einer der beiden MACs +1 LLDP Pakete raus, was die Community-IX-Leute stört. Die NICs haben …13:88 und …13:8c, die LLDPs kommen von …13:89 - und wir selbst sehen die LLDP-Pakete auf dem System nicht.


#10

Verständlich dass das die Kollegen stört, so was ist an Exchanges eher unüblich :wink:
Aber versuch das mal mit hbacmd auszuschalten, vermutlich gehört das zum iSCSI Offloading.

hbacmd SetDCBParam $MAC_im_Format_00-00-00-00-00-00 TxState 0
hbacmd SetDCBParam $MAC_im_Format_00-00-00-00-00-00 RxState 0

-> weitere Details: https://docs.broadcom.com/docs/13357169


#11

Danke für den Tipp.

Ich hab nun mal CentOS 6 in ein chroot geworfen, hbacmd findet nix:

bash-4.1# hbacmd GetDCBParam d4-c9-ef-76-13-88

The specified port does not exist on the local host.
The 'h=' option must be specified to access remote ports

Könnnte man das ggf auch per lldptool -t -i enp1s0f0 -V CEE-DCBX oder sowas deaktivieren?


#12

Nachtrag:

The adapter uses the second or the MAC+1 port address for LLDP/DCBX
(Link Layer Discovery Protocol)/(Data Center Bridging eXchange) link exchange. The
DCBX engine is built into the network controller ASIC for FCoE and is always active although FCoE
is not supported. This MAC+1 address remains constant
and is not changed with OFM. The forwarding data base of the switch will
show the Ethernet Base port MAC + 1 address value. A user may expect to only
see the port Base MAC address. This is a potential point of confusion for
a user who is unaware of the reason why the base MAC+1 address is present.

Quelle

Es geht da um eine andere Karte mit be2net-Modul und ähnlichem Phänomenen. Somit frage ich mich, ob die Karte letztlich überhaupt an einem IX nutzbar ist, sofern sich der LLDP/DCBX-Kram nicht abschalten lässt.LLDP/DCBX


#13

Merke: man sollte den entsprechenden Daemon im Centos-Chroot auch starten, dann klappts auch mit hbacmd:

hbacmd GetDCBParam xx-xx-xx-xx-13-88

DCBX

Operating Version : 0
Maximum Version : 0

Param Description Param Name Value


DCBX State dcbxstate Disabled

LLDP

Transmit State txstate Disabled
Receive State rxstate Disabled
Transmit Port Description txportdesc Disabled
Transmit System Description txsysdesc Enabled
Transmit System Name txsysname Disabled

Transmit System Capabilities txsyscap Enabled