<div><br></div>AFM apparently keeps track og this, so maybe it would be possible to run AFM-SW with disconnected home and query the queue of changes? But would require some way of clearing the queue as well..<div><br></div><div><br></div><div><span style="color:rgb(50,50,50);font-family:monospace,monospace;font-size:16px;white-space:pre;background-color:rgb(236,236,236)"><br></span></div><div><br></div><div><br></div><div>  -jf<br><div><br>On Monday, February 27, 2017, Marc A Kaplan <<a href="mailto:makaplan@us.ibm.com">makaplan@us.ibm.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><font size="2" face="sans-serif">Diffing file lists can be fast - IF you
keep the file lists sorted by a unique key, e.g. the inode number.</font><br><font size="2" face="sans-serif">I believe that's how mmbackup does it.
 Use the classic set difference algorithm.<br></font><br><font size="2" face="sans-serif">Standard diff is designed to do something
else and is terribly slow on large file lists.</font><br><br><br><br><font size="1" color="#5f5f5f" face="sans-serif">From:      
 </font><font size="1" face="sans-serif">Edward Wahl <<a href="javascript:_e(%7B%7D,'cvml','ewahl@osc.edu');" target="_blank">ewahl@osc.edu</a>></font><br><font size="1" color="#5f5f5f" face="sans-serif">To:      
 </font><font size="1" face="sans-serif">"Simon Thompson
(Research Computing - IT Services)" <<a href="javascript:_e(%7B%7D,'cvml','S.J.Thompson@bham.ac.uk');" target="_blank">S.J.Thompson@bham.ac.uk</a>></font><br><font size="1" color="#5f5f5f" face="sans-serif">Cc:      
 </font><font size="1" face="sans-serif">gpfsug main discussion
list <<a href="javascript:_e(%7B%7D,'cvml','gpfsug-discuss@spectrumscale.org');" target="_blank">gpfsug-discuss@spectrumscale.<wbr>org</a>></font><br><font size="1" color="#5f5f5f" face="sans-serif">Date:      
 </font><font size="1" face="sans-serif">02/27/2017 03:51 PM</font><br><font size="1" color="#5f5f5f" face="sans-serif">Subject:    
   </font><font size="1" face="sans-serif">Re: [gpfsug-discuss]
Tracking deleted files</font><br><font size="1" color="#5f5f5f" face="sans-serif">Sent by:    
   </font><font size="1" face="sans-serif"><a href="javascript:_e(%7B%7D,'cvml','gpfsug-discuss-bounces@spectrumscale.org');" target="_blank">gpfsug-discuss-bounces@<wbr>spectrumscale.org</a></font><br><hr noshade><br><br><br><tt><font size="2">I can think of a couple of ways to do this.  But
using snapshots seems heavy,<br>but so does using mmbackup unless you are already running it every day.
<br><br>Diff the shadow files?  Haha could be a _terrible_ idea if you have
a couple<br>hundred million files. But it IS possible. <br><br><br>Next, I'm NOT a tsm expert, but I know a bit about it: (and I probably
stayed<br>at a Holiday Inn express at least once in my heavy travel days)<br><br>-query objects using '-ina=yes' and yesterdays date? Might be a touch slow.
But<br>it probably uses the next one as it's backend:<br><br>-db2 query inside TSM to see a similar thing.  This ought to be the
fastest,<br>and I'm sure with a little google'ing you can work this out.  Tivoli
MUST know<br>exact dates of deletion as it uses that and the retention time to know<br>when to purge/reclaim deleted objects from it's storage pools.<br>(retain extra version or RETEXTRA or retain only version) <br><br>Ed<br><br>On Mon, 27 Feb 2017 13:32:42 +0000<br>"Simon Thompson (Research Computing - IT Services)" <<a href="javascript:_e(%7B%7D,'cvml','S.J.Thompson@bham.ac.uk');" target="_blank">S.J.Thompson@bham.ac.uk</a>><br>wrote:<br><br>> >It has been discussed in the past, but the way to track stuff
is to<br>> >enable HSM and then hook into the DSMAPI. That way you can see
all the<br>> >file creates and deletes "live".  <br>> <br>> Won't work, I already have a "real" HSM client attached
to DMAPI<br>> (dsmrecalld).<br>> <br>> I'm not actually wanting to backup for this use case, we already have<br>> mmbackup running to do those things, but it was a list of deleted
files<br>> that I was after (I just thought it might be easy given mmbackup is<br>> tracking it already).<br>> <br>> Simon<br>> <br>> ______________________________<wbr>_________________<br>> gpfsug-discuss mailing list<br>> gpfsug-discuss at <a href="http://spectrumscale.org" target="_blank">spectrumscale.org</a><br>> </font></tt><a href="http://gpfsug.org/mailman/listinfo/gpfsug-discuss" target="_blank"><tt><font size="2">http://gpfsug.org/mailman/<wbr>listinfo/gpfsug-discuss</font></tt></a><tt><font size="2"><br><br><br><br>-- <br><br>Ed Wahl<br>Ohio Supercomputer Center<br>614-292-9302<br>______________________________<wbr>_________________<br>gpfsug-discuss mailing list<br>gpfsug-discuss at <a href="http://spectrumscale.org" target="_blank">spectrumscale.org</a><br></font></tt><a href="http://gpfsug.org/mailman/listinfo/gpfsug-discuss" target="_blank"><tt><font size="2">http://gpfsug.org/mailman/<wbr>listinfo/gpfsug-discuss</font></tt></a><tt><font size="2"><br><br></font></tt><br><br></blockquote></div></div>