<div dir="ltr">In general, the need to restripe after a disk add is dependent on a number of factors, as has been pointed out.. A couple of other thoughts/suggestions:<div><br></div><div>- One thing you might consider (depending on your pattern of read/write traffic), is selectively suspending one or more of the existing NSDs, forcing GPFS to write new blocks to the new NSDs. That way at least some of the new data is being written to the new storage by default, rather than using up blocks on the existing NSDs. You can suspend/resume disks at any time.</div><div><br></div><div>- You can pick a subset of nodes to perform the restripe with "mmrestripefs -N node1,node2,..." Keep in mind you'll get much better performance and less impact to the filesystem if you choose NSD servers with direct access to the disk.</div><div><br></div><div>- Resume of restripe: Yes, you can do this, no harm, done it many times. You can track the balance of the disks using "mmdf <filesystem>". This is a pretty intensive command, so I wouldn't run in frequently. Check it a few times each day, see if the data balance is improving by itself. When you stop/restart it, the restripe doesn't pick up exactly where it left off, it's going to scan the entire file system again.</div><div><br></div><div>- You can also restripe single files if the are large and get a heavy I/O (mmrestripefile)<br><div class="gmail_extra"><div><div class="gmail_signature"><div dir="ltr"><br><div>Bob Oesterlin</div><div>Nuance Communications</div><div><br></div></div></div></div>
<br><div class="gmail_quote">On Mon, Nov 24, 2014 at 3:22 PM, Stijn De Weirdt <span dir="ltr"><<a href="mailto:stijn.deweirdt@ugent.be" target="_blank">stijn.deweirdt@ugent.be</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">hi all,<br>
<br>
we are going to expand an existing filestytem with approx 50% capacity. the current filesystem is 75% full.<br>
<br>
we are in downtime (for more then just this reason), so we can take the IO rebalance hit for a while (say max 48hours).<br>
<br>
my questions:<br>
a. do we really need to rebalance? the mmadddisk page suggest normally it's going to be ok, but i never understood that. new data will end up mainly on new disks, so wrt to performance, this can't really work out, can it?<br>
b. can we change the priority of rebalancing somehow (fewer nodes taking part in the rebalance?)<br>
c. once we start the rebalance, how save is it to stop with kill or ctrl-c (or can we say eg. rebalance 25% now, rest later?)<br>
(and how often can we do this? eg a daily cron job to restripe at max one hour per day, would this cause issue in the long term<br>
<br>
<br>
many thanks,<br>
<br>
stijn<br>
______________________________<u></u>_________________<br>
gpfsug-discuss mailing list<br>
gpfsug-discuss at <a href="http://gpfsug.org" target="_blank">gpfsug.org</a><br>
<a href="http://gpfsug.org/mailman/listinfo/gpfsug-discuss" target="_blank">http://gpfsug.org/mailman/<u></u>listinfo/gpfsug-discuss</a><br>
</blockquote></div><br></div></div></div>