<div dir="ltr">Hi Tim,<div><br></div><div>I'm assuming here that we are talking about storage in publicly accessible data catalogs.  There is certainly gray area between transparency and usability, and it may be worth sitting down with any researchers responsible for producing the data.  They may have a good feel for what is expected and considered useful within a sub-discipline.</div><div><br></div><div>We would not distribute pre-QC'd data or Monte-Carlo datasets (except on request), nor would we include "working fields" used to calculate final results.  These have little value to the end user, IMO.  However, post-QC data that includes "bad", flagged data seems reasonable to share, especially when some discretion is used when determining what data to exclude from analyses.  I would also avoid duplicated information, such as temperatures in both C and F (unless someone with more expertise felt it was standard in the field to present both).</div><div><br></div><div>For local archiving, I would store at least the initial and final versions of datasets, with some information regarding how the latter was generated from the former.  For most of our data, we expect this to happen at the researcher, not the site, level.  As IM, I don't necessarily need to know how C was converted to F, or even that the initial measurements were in C.   </div><div><br></div><div>Perhaps I am restating the question more than answering it.  There is a certain amount of judgement that is applied to these issues, and I think it is difficult to create a general rule that is applicable to all datasets.</div><div><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><pre cols="72"><font face="arial, helvetica, sans-serif" size="3">--</font></pre><pre cols="72"><font face="arial, helvetica, sans-serif">Dan Bahauddin
<i>Information Manager

Cedar Creek Ecosystem Science Reserve
2660 Fawn Lake Dr. NE
East Bethel, MN 55005 

Office:  612-301-2603
Fax:  612-301-2626</i></font></pre></div></div></div>
<br><div class="gmail_quote">On Fri, Jun 1, 2018 at 11:01 AM, Whiteaker, Timothy L <span dir="ltr"><<a href="mailto:whiteaker@utexas.edu" target="_blank">whiteaker@utexas.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all,<br>
<br>
Are there guidelines which describe **what** LTER data should be archived?  For example, should we be archiving these things?<br>
* Raw sensor data, or just QC'd result <br>
* 1000s of Monte-Carlo datasets, or just summary of the result<br>
* Columns originally used for intermediate calculations in Excel, like a column that multiples Celsius by 9/5, and another column that adds 32 to it to get F<br>
<br>
I'm aiming for usefulness and reproducibility, but sometimes I have a hard time determining how far back to take the data (as in the first example above) to have it still count as reproducible. <br>
<br>
Thanks!<br>
<br>
Tim Whiteaker<br>
Research Scientist<br>
The University of Texas at Austin<br>
______________________________<wbr>_________________<br>
Long Term Ecological Research Network<br>
im mailing list<br>
<a href="mailto:im@lternet.edu">im@lternet.edu</a><br>
<br>
</blockquote></div><br></div>