<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">Hi Kevin,</span>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><br>
</span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">I think there is some misconception
 about how FSStruct errors are detected and handled. </span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><br>
</span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">All nodes in a Storage Scale
 cluster have a health monitoring daemon running (backend for mmhealth cmd) which monitors the individual components and listens to callbacks to detect issues like FSStruct errors.</span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">As you correctly mentioned,
 the FSStruct callbacks will be fired on the Filesystem-Manager nodes only and therefore raise a new mmhealth event on that node. </span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">You can see those events running
</span><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);"><b><i>mmhealth node show</i></b></span><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"> 
 on that node. <br>
<br>
Irrespective of the fact if this is an EMS node or an IO node, mmhealth will forward any event to the cluster manager to provide a consolidated cluster wide state view (</span><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);"><b>mmhealth
 cluster show</b></span><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">) </span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">In addition, all events will
 be forwarded to the GUI, which will show those events as alerts. </span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><br>
</span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">Since many customers have
 their own monitoring system we provide multiple ways to get notified about new events:</span></div>
<ul style="text-align: left; margin-block: 0px; list-style-type: disc;">
<li style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; font-weight: 400; color: rgb(0, 0, 0);">
<span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">Scale GUI allows to configure Email notifications or SNMP traps <br>
<a href="https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=gui-event-notifications" id="OWA5cc75847-075c-dcef-5451-8fce3221dbe1" class="OWAAutoLink" style="margin: 0px;">https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=gui-event-notifications</a></span></li></ul>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><br>
</span></div>
<ul style="text-align: left; margin-block: 0px; list-style-type: disc; flex-direction: column; display: flex;">
<li style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; font-weight: 400; color: rgb(0, 0, 0);">
<span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">mmhealth offers a modern webhook interface <br>
<a href="https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=command-configuring-webhook-by-using-mmhealth" id="OWA1712c3d7-2ef5-bc0b-5574-88349cd97309" class="OWAAutoLink" style="margin: 0px;">https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=command-configuring-webhook-by-using-mmhealth</a><br>
<br>
</span></li><li style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; font-weight: 400; color: rgb(0, 0, 0); align-self: start;">
<span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">mmhealth can call user defined scripts to trigger any custom notification
 tool</span></li></ul>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">     
<a href="https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=mhn-running-user-defined-script-when-event-is-raised" id="OWAe1ea4750-a208-7d6f-ec24-88405f3ac2f0" class="OWAAutoLink" style="margin: 0px;">
https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=mhn-running-user-defined-script-when-event-is-raised</a><br>
<br>
</span></div>
<ul style="text-align: left; margin-block: 0px; list-style-type: disc;">
<li style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; font-weight: 400; color: rgb(0, 0, 0);">
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">3<sup>rd</sup> party monitoring
 tools can use the REST API or mmhealth CLIs to poll the system status </span></div>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><a href="https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=endpoints-nodesnamehealthstates-get" id="OWAa0edf529-17a6-8415-54d7-a5ff99152b22" class="OWAAutoLink" style="margin: 0px;">https://www.ibm.com/docs/en/storage-scale/5.1.9?topic=endpoints-nodesnamehealthstates-get</a><br>
<br>
</span></div>
</li></ul>
<div style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">Depending on which option
 you choose and where your external monitoring system is running you need to ensure that there is a network route to the system.<br>
(e.g. GUI Email & SNMP need the EMS node to talk to the server, webhook/custom script will need any node to talk to the server) </span></div>
<div class="elementToProof" style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 14.6667px; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255); font-weight: 400;">ESS
 IO nodes are not necessarily restricted to an internal network. We have many customers who attach their ESS to their campus network for central management and monitoring.</span></div>
<div class="elementToProof" style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;"><br>
</span></div>
<div class="elementToProof" style="text-align: left; margin: 0px;"><span style="letter-spacing: normal; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0); font-weight: 400;">If
 you have further questions or want to hear more about monitoring & notifications, I can offer to schedule a webex session with you. </span></div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
<br>
</div>
<div id="Signature">
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">best regards<br>
<br>
Mathias Dietz</span></div>
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);"><br>
</span></div>
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">Storage Scale RAS Architect <br>
<br>
IBM Deutschland Research & Development GmbH</span></div>
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">Vorsitzender des Aufsichtsrats: Wolfgang Wendt</span></div>
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">Geschäftsführung: David Faller</span></div>
<div><span style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">Sitz der Gesellschaft: Böblingen / Registergericht: Amtsgericht Stuttgart, HRB 243294</span></div>
</div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> gpfsug-discuss <gpfsug-discuss-bounces@gpfsug.org> on behalf of Buterbaugh, Kevin Lynn <klbuter@sandia.gov><br>
<b>Sent:</b> Wednesday, January 24, 2024 6:08 PM<br>
<b>To:</b> gpfsug-discuss@spectrumscale.org <gpfsug-discuss@spectrumscale.org><br>
<b>Subject:</b> [EXTERNAL] [gpfsug-discuss] Wouldn't you like to know if you had filesystem corruption?</font>
<div> </div>
</div>
<div>
<div style="display:none!important; display:none; visibility:hidden; font-size:1px; color:#ffffff; line-height:1px; height:0px; max-height:0px; opacity:0; overflow:hidden">
Hi All, Wouldn’t you like to know if your IBM ESS had filesystem corruption? If you answered “no” my guess is that you’ve never experienced undetected filesystem corruption! 😉 Did you know that if you’ve got an IBM ESS set up in its’
</div>
<div style="display:none!important; display:none; visibility:hidden; font-size:1px; color:#ffffff; line-height:1px; height:0px; max-height:0px; opacity:0; overflow:hidden">
</div>
<style>
<!--
#x_pfptBanner40rkhvi
        {display:block!important;
        visibility:visible!important;
        opacity:1!important;
        background-color:#D0D8DC!important;
        max-width:none!important;
        max-height:none!important}
-->
</style>
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style>
<!--
@font-face
        {font-family:"Cambria Math"}
@font-face
        {font-family:Aptos}
@font-face
        {font-family:"IBM Plex Sans"}
p.x_MsoNormal, li.x_MsoNormal, div.x_MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Aptos",sans-serif}
a:link, span.x_MsoHyperlink
        {color:#467886;
        text-decoration:underline}
.x_MsoChpDefault
        {font-size:11.0pt;
        font-family:"Aptos",sans-serif}
@page WordSection1
        {margin:1.0in 1.0in 1.0in 1.0in}
div.x_WordSection1
        {}
-->
</style>
<div class="x_WordSection1">
<p class="x_MsoNormal">Hi All,</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Wouldn’t you like to know if your IBM ESS had filesystem corruption?  If you answered “no” my guess is that you’ve never experienced undetected filesystem corruption! 
<span style="font-family:"Apple Color Emoji"">😉</span></p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Did you know that if you’ve got an IBM ESS set up in its’ default configuration, which also matches the recommended configuration in every last piece of IBM documentation that I’ve ever come across, you WILL NOT be notified of filesystem
 corruption?!?</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Do you think IBM should fix this ASAP?  If so, please up vote
<a href="https://ideas.ibm.com/ideas/ESS-I-61">https://ideas.ibm.com/ideas/ESS-I-61</a>.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">If you, like me, consider this a bug in the existing product and not a “feature enhancement” to maybe be included in some future release if we’re lucky, then please keep reading.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Here’s the gory details to the best of my understanding…</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Your IBM ESS can and will detect filesystem corruption (FS_STRUCT errors).  But it currently will NOT, and cannot, let you know that it’s happened.  The reason is that FS_STRUCT errors are detected only on the filesystem manager node,
 which makes sense.  But if you’re running in the default and recommended configuration your filesystem manager node is one of the I/O nodes, not the EMS node.  The I/O nodes have no way to communicate anything out to you unless IBM decides to configure them
 to do so – like they ALREADY DO with other things like hardware events – by routing the error thru the EMS node which can send it on to you.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">You could fix this problem yourself by writing a custom callback script to send you an e-mail (or a text) whenever an FS_STRUCT error is detected by the filesystem manager node … EXCEPT that you’d need mailx / postfix or something like
 that and IBM doesn’t provide you with a way to install them on the I/O nodes.  As an aside, if you’re NOT on an ESS (i.e. running GPFS on some sort of commodity hardware) you can and should do this!</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">There is a workaround for this issue, which is to run your filesystem manager(s) on the EMS node.  However, 1) this goes against IBM’s recommendations (and defaults), and 2) is not possible for larger ESS systems as the EMS node doesn’t
 have enough RAM to handle the filesystem manager function.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Personally, I think it’s absolutely crazy that an I/O node can tell you that you’ve got a pdisk failure but can’t tell you that you’ve got filesystem corruption!  If you agree, then please up vote the RFE above.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal"><rant></p>
<p class="x_MsoNormal">Even if you don’t agree, let me ask you to consider up voting the RFE anyway.  Why?  To send a message to IBM that you consider it unacceptable for them to allow a customer (me, obviously) to open up a support ticket for this very issue
 (again, I consider this a very serious bug, not a feature enhancement) in July of 2023, work with the customer for 6 months, and then blow the customer off by telling them, and I quote:</p>
<p class="x_MsoNormal"> </p>
<p style="margin:0in; line-height:18.0pt; vertical-align:baseline">“<span style="font-size:9.0pt; font-family:"IBM Plex Sans",sans-serif; color:#161616">As per the dev team, this feature has been in this way since really old versions and has not changed which
 means that is not going to change soon.  You can request an RFE with your idea for the development team to take it into account. Below I share the link where you can share your idea (RFE):”</span></p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">“Not going to change soon.”  Thanks for nothing, IBM … well, I do appreciate your honesty.  I’ve got one other RFE out there - submitted in August of 2022 - and its’ status is still “Future Consideration.”  I guess I’ll just keep my fingers
 crossed that I never have filesystem corruption on an ESS.  But if I do, let me highly recommend to you that you not assign me one of your support personnel who does not understand that 1 plus 4 does not equal 6 … or that October comes before November on the
 calendar (both of which I have actually had happen to me in the last 6 months; no, sadly, I am not joking or exaggerating in the least).</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">To all the IBMers reading this I want you to know that I personally consider the ESS and GPFS to be the best storage solution out there from a technical perspective … I truly do.  But that is rapidly becoming irrelevant when you are also
 doing things like the above, especially when you are overly proud (I think you know what I mean) of your support even if it was good, which it used to be but sadly no longer is.</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">IBMers, I’m sure you don’t like this bit of public shaming.  Guess what?  I don’t like doing it.  But I have complained directly to IBM about these things for quite some time now (ask my sales rep if you don’t believe me) and it’s done
 no good whatsoever.  Not only did I count to 100 before composing this e-mail, I slept on it.  I don’t know what else to do when things aren’t changing.  But I promise you this, if you’ll stop doing stuff like this I will absolutely be more than glad to never
 have to send another e-mail like this one again.  Deal?</p>
<p class="x_MsoNormal"></rant></p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Thank you, all…</p>
<p class="x_MsoNormal"> </p>
<p class="x_MsoNormal">Kevin B.</p>
<p class="x_MsoNormal"> </p>
</div>
</div>
</body>
</html>