<html><body><p><font size="2">Why do you need to run any kind of monitoring client on an IO server the GUI / performance monitor already does all of that work for you and collects the data on the dedicated EMS server.<br></font><font size="2"><br></font><font size="2">If you have a small storage environment the. Yes the processor and memory may feel like overkill, but tuned appropriately an IO server will use all the memory you can give it to drive IO performance, <br></font><font size="2"><br></font><font size="2">If you want to run a hybrid / non standard architecture then the IBM ESS / DGSS platform may not be the right platform in comparison to a build your own architecture, how ever you then take all the support issues onto your self rather than it being the vendors problem.  <br></font><font size="2"><br></font><font size="2">Sent from my iPhone<br></font><font size="2"><br></font><font size="2">> On 3 Oct 2020, at 20:06, Jonathan Buzzard <jonathan.buzzard@strath.ac.uk> wrote:<br></font><font size="2">> <br></font><font size="2">> On 02/10/2020 23:19, Andrew Beattie wrote:<br></font><font size="2">>> Jonathan,<br></font><font size="2">>> I suggest you get a formal statement from Lenovo as the DSS-G Platform <br></font><font size="2">>> is no longer an IBM platform.<br></font><font size="2">>> <br></font><font size="2">>> But for ESS based platforms the answer would be, it is not supported to <br></font><font size="2">>> run anything on the IO Servers other than GNR and the relevant Scale <br></font><font size="2">>> management services, due to the fact that if you lose an IO Server, or <br></font><font size="2">>> if you in an extended maintenance window the Server needs to host all <br></font><font size="2">>> the work that would be being performed by both IO servers.<br></font><font size="2">>> <br></font><font size="2">> <br></font><font size="2">> In the past ~500 days the Infiniband to Ethernet gateway has shifted <br></font><font size="2">> ~13GB of data, or about 25MB a day. Meanwhile in the last 470 days the <br></font><font size="2">> DSS-G nodes have each shifted several PB. The proposed additional <br></font><font size="2">> traffic is a drop in the ocean.<br></font><font size="2">> <br></font><font size="2">> On my actual routers which shift much more data (over 300TB externally) <br></font><font size="2">> with an uptime of ~180 days at the moment the CPU time consumed by <br></font><font size="2">> keepalived is just under 31 minutes or about 8 seconds a day. These are <br></font><font size="2">> much punier CPU's too. The proposed additional CPU usage is another drop <br></font><font size="2">> in the ocean.<br></font><font size="2">> <br></font><font size="2">> Given Lenovo sold the *same* configuration with x3650's and SR650's the <br></font><font size="2">> "need all the CPU grunt" is somewhat fishy. Between the bid being <br></font><font size="2">> submitted and actual tender award the SR650's came out and we paid a bit <br></font><font size="2">> extra to uplift to the newer server hardware with exactly the same disk <br></font><font size="2">> configuration. I believe IBM have done the same with the ESS/GNR servers <br></font><font size="2">> too over time the same applies there too.<br></font><font size="2">> <br></font><font size="2">> IMHO given keepalived is a base RHEL package, IBM/Lenovo should be <br></font><font size="2">> offering running Infiniband to Ethernet gateways on the DSS/ESS nodes as <br></font><font size="2">> a supported configuration for mixed network technology clusters :-)<br></font><font size="2">> <br></font><font size="2">> Running a couple extra servers for this purpose is obnoxious from an <br></font><font size="2">> environmental standpoint. That's IBM's green credentials out the window <br></font><font size="2">> if you ask me.<br></font><font size="2">> <br></font><font size="2">> I would note under those rules running a Nagios, Zabbix etc. client on <br></font><font size="2">> the nodes is not permitted either. I would suggest that most sites would <br></font><font size="2">> be rather unhappy about that :-)<br></font><font size="2">> <br></font><font size="2">> <br></font><font size="2">>> I don't know if Lenovo have different point if view.<br></font><font size="2">>> <br></font><font size="2">> <br></font><font size="2">> Problem is when I ring up for support on my DSS-G I speak to an IBM <br></font><font size="2">> employee not a Lenovo one :-)<br></font><font size="2">> <br></font><font size="2">> <br></font><font size="2">> JAB.<br></font><font size="2">> <br></font><font size="2">> -- <br></font><font size="2">> Jonathan A. Buzzard                         Tel: +44141-5483420<br></font><font size="2">> HPC System Administrator, ARCHIE-WeSt.<br></font><font size="2">> University of Strathclyde, John Anderson Building, Glasgow. G4 0NG<br></font><font size="2">> _______________________________________________<br></font><font size="2">> gpfsug-discuss mailing list<br></font><font size="2">> gpfsug-discuss at spectrumscale.org<br></font><font size="2">> <a href="http://gpfsug.org/mailman/listinfo/gpfsug-discuss">http://gpfsug.org/mailman/listinfo/gpfsug-discuss</a> <br></font><font size="2">> <br></font><BR>
</body></html>