<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Helvetica,sans-serif;" dir="ltr">
<p>Dear Marc,</p>
<p><br>
</p>
<p>well as I think I cannot simply "move" dependent filesets between independent ones and our customers must have the opportunity to change data protection policy for their Containers at any given time, I cannot map them to a "backed up" or "not backed up"
 independent fileset.</p>
<p><br>
</p>
<p>So how much performance impact is lets say 1-10 exclude.dir directives per independent fileset?</p>
<p><br>
</p>
<p>Many thanks in advance.</p>
<p>Best Regards,</p>
<p>Stephan Peinkofer</p>
<br>
<br>
<div style="color: rgb(0, 0, 0);">
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> gpfsug-discuss-bounces@spectrumscale.org <gpfsug-discuss-bounces@spectrumscale.org> on behalf of Marc A Kaplan <makaplan@us.ibm.com><br>
<b>Sent:</b> Tuesday, August 14, 2018 5:31 PM<br>
<b>To:</b> gpfsug main discussion list<br>
<b>Subject:</b> Re: [gpfsug-discuss] GPFS Independent Fileset Limit vs Quotas?</font>
<div> </div>
</div>
<div><span style="font-size:10pt; font-family:sans-serif">True, mmbackup is designed to work best backing up either a single independent fileset or the entire file system.  So if you know some filesets do not need to be backed up, map them to one or more indepedent
 filesets that will not be backed up.    </span><br>
<br>
<span style="font-size:10pt; font-family:sans-serif">mmapplypolicy is happy to scan a single dependent fileset, use option --scope fileset and make the primary argument the path to the root of the fileset you wish to scan.   The overhead is not simply described.
   The directory scan phase will explore or walk the (sub)tree in parallel with multiple threads on multiple nodes, reading just the directory blocks that need to be read.</span><br>
<br>
<span style="font-size:10pt; font-family:sans-serif">The inodescan phase will read blocks of inodes from the given inodespace ...  since the inodes of dependent filesets may be "mixed" into the same blocks as other dependend filesets that are in the same independent
 fileset, mmapplypolicy will incur what you might consider "extra" overhead.</span><br>
<br>
<br>
<br>
<br>
<span style="font-size:9pt; color:#5f5f5f; font-family:sans-serif">From:        </span><span style="font-size:9pt; font-family:sans-serif">"Peinkofer, Stephan" <Stephan.Peinkofer@lrz.de></span><br>
<span style="font-size:9pt; color:#5f5f5f; font-family:sans-serif">To:        </span><span style="font-size:9pt; font-family:sans-serif">gpfsug main discussion list <gpfsug-discuss@spectrumscale.org></span><br>
<span style="font-size:9pt; color:#5f5f5f; font-family:sans-serif">Date:        </span><span style="font-size:9pt; font-family:sans-serif">08/14/2018 12:50 AM</span><br>
<span style="font-size:9pt; color:#5f5f5f; font-family:sans-serif">Subject:        </span><span style="font-size:9pt; font-family:sans-serif">Re: [gpfsug-discuss] GPFS Independent Fileset Limit vs Quotas?</span><br>
<span style="font-size:9pt; color:#5f5f5f; font-family:sans-serif">Sent by:        </span><span style="font-size:9pt; font-family:sans-serif">gpfsug-discuss-bounces@spectrumscale.org</span><br>
<hr noshade="">
<br>
<br>
<br>
<span style="font-size:12pt">Dear Marc,</span><br>
<br>
<br>
<span style="font-size:10pt; font-family:sans-serif">If you "must" exceed 1000 filesets because you are assigning each project to its own fileset, my suggestion is this:</span><span style="font-size:12pt"><br>
</span><span style="font-size:10pt; font-family:sans-serif"><br>
Yes, there are scaling/performance/manageability benefits to using mmbackup over independent filesets.</span><span style="font-size:12pt"><br>
</span><span style="font-size:10pt; font-family:sans-serif"><br>
But maybe you don't need 10,000 independent filesets --  <br>
maybe you can hash or otherwise randomly assign projects that each have their own (dependent) fileset name to a lesser number of independent filesets that will serve as management groups for (mm)backup...</span><span style="font-size:12pt"><br>
</span><br>
<span style="font-size:12pt">OK, if that might be doable, whats then the performance impact of having to specify Include/Exclude lists for each independent fileset in order to specify which dependent fileset should be backed up and which one not?</span><br>
<span style="font-size:12pt">I don’t remember exactly, but I think I’ve heard at some time, that Include/Exclude and mmbackup have to be used with caution. And the same question holds true for running mmapplypolicy for a “job” on a single dependent fileset?
 Is the scan runtime linear to the size of the underlying independent fileset or are there some optimisations when I just want to scan a subfolder/dependent fileset of an independent one?</span><br>
<br>
<span style="font-size:10pt; font-family:sans-serif">Like many things in life, sometimes compromises are necessary!</span><br>
<span style="font-size:12pt"><br>
Hmm, can I reference this next time, when we negotiate Scale License pricing with the ISS sales people? ;)</span><br>
<br>
<span style="font-size:12pt">Best Regards,</span><br>
<span style="font-size:12pt">Stephan Peinkofer</span><br>
<tt><span style="font-size:10pt">_______________________________________________<br>
gpfsug-discuss mailing list<br>
gpfsug-discuss at spectrumscale.org<br>
</span></tt><a href="http://gpfsug.org/mailman/listinfo/gpfsug-discuss" id="LPlnk766161" previewremoved="true"><tt><span style="font-size:10pt">http://gpfsug.org/mailman/listinfo/gpfsug-discuss</span></tt></a><tt><span style="font-size:10pt"><br>
</span></tt><br>
<br>
<br>
</div>
</div>
</div>
</body>
</html>