<div dir="ltr">Thank you for your thoughtful reply.  Sorry for the late response.  As you know we have a lot going on right now.  I like your description of your own streamflow and precipitation data method.  Perhaps we could do it similarly.<div><ol><li>Be sure to especially cite creator and title</li><li>Create a BES dataset from the USGS data derived into the form we used it for </li><li>Title it accordingly and include it.</li><li>If the case is that we do not derive it at all, then we just create a dataset of the values we used and cite it as above and include it.</li></ol><div>Also thanks for the MBON flow chart.  Very nice.</div></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Sep 20, 2017 at 2:14 PM, Margaret O'Brien <span dir="ltr"><<a href="mailto:margaret.obrien@ucsb.edu" target="_blank">margaret.obrien@ucsb.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Hi Jonathan -</div><div><br></div><div>I see several ways to answer this question. Ideally, there is a way to handle different sources of data without complicating your IM system too much. And I hope this answer is not too complicated, either.</div><div><br></div><div>It's pretty simple to link to other sources. SBC LTER does it on the main data page (<a href="http://sbc.lternet.edu/data/" target="_blank">http://sbc.lternet.edu/data/</a>)<wbr>. But some of these we use for our LTER research, so they have been turned into datasets with EML, too.  At SBC LTER, we call this "exogenous data", or "Type 0". And so our re-packaging turns it into "Type I". But we do try to make it clear where it came from. </div><div><br></div><div>Particularly in the watersheds, there are a number of these, including from the USGS. I should add though, that we don't get the USGS data that we use from their website, we get their highest resolution data thru back-channels at the end of the water year after it's been QC'd.  In total, SBC LTER has 30-40 datasets like this, including both precipitation and stream flow.</div><div><br></div><div>For stream flow and precip, we use these rules for creating datasets from exogenous dat. Keep in mind that the most visible parts of a citation are the creators and title, so these are important.</div><div>1. the data are reformatted to match our own (so they can be used together - now they are Type 1). Since stream flow is calc'd from stage height, and we do that part here, we do call it "ours"</div><div>2. creator is the primary PI conducting that part of the project</div><div>3. the dataset title names the source (if not us), and has both the original station and our station id in it. </div><div>4. the abstract also names the source</div><div><br></div><div>Here are some examples:</div><div>our data from a USGS stream gauge:</div><div><a href="http://sbc.lternet.edu/cgi-bin/showDataset.cgi?docid=knb-lter-sbc.3018" target="_blank">http://sbc.lternet.edu/cgi-bin<wbr>/showDataset.cgi?docid=knb-lte<wbr>r-sbc.3018</a><br></div><div><br></div><div>A similar dataset from one of our own height-gauges:</div><div><a href="http://sbc.lternet.edu/cgi-bin/showDataset.cgi?docid=knb-lter-sbc.3007" target="_blank">http://sbc.lternet.edu/cgi-bin<wbr>/showDataset.cgi?docid=knb-lte<wbr>r-sbc.3007</a><br></div><div><br></div><div>precipitation data collected by the county:</div><div><a href="http://sbc.lternet.edu/cgi-bin/showDataset.cgi?docid=knb-lter-sbc.5012" target="_blank">http://sbc.lternet.edu/cgi-bin<wbr>/showDataset.cgi?docid=knb-lte<wbr>r-sbc.5012</a><br></div><div><br></div><div>We have other exogenous data where we did nothing to it at all -- all we do is repost. These are mostly for reference, and for those, we make no claim to this data (unless we treated it somehow, like aggregating).</div><div>So those rules:</div><div>1. data are in original format</div><div>2. creator is original org (not us)</div><div>3. dataset title shows is as close as we can get to what it was when received or downloaded. It may take a phone call to get it right.</div><div>4. contact - add one for the org, too.</div><div><br></div><div>e.g., here is some KML data, that describes the perimeter of a recent fire. <br></div><div><a href="http://sbc.lternet.edu/cgi-bin/showDataset.cgi?docid=knb-lter-sbc.70" target="_blank">http://sbc.lternet.edu/cgi-bin<wbr>/showDataset.cgi?docid=knb-lte<wbr>r-sbc.70</a><br></div><div><br></div><div><br></div><div><br></div><div>Another project I work with is a biodiversity observation network (BON). Most of the data they work with are exogenous, and a lot of what the BON does is to curate that data so they can use it in integrated research, and create datasets along the way. They have adopted the LTER data management protocols, including the whole EML > EDI > DataONE pathway.</div><div><br></div><div>So we highlight the packaging guidelines for different types (de novo, curated exogenous, integration products)</div><div>For that, see "Data Packaging", here: <a href="http://sbc.marinebon.org/data/overview/" target="_blank">http://sbc.marinebon.org/data/<wbr>overview/</a><br></div><div>These are very similar to what we do with LTER, but the process is more formalized. </div><div><br></div><div><br></div><div>One more note:</div><div>EML has an area for describing "source data", under methods. Use it if you can. There is a node called sourceData, that works for holding info about another PASTA dataset. For URLs that are non-pasta, the only current option is to use the text fields. </div><div>Here is an example for one of the biodiversity datasets that integrates data from 4 projects (open up Metadat > Methods):</div><div><a href="https://portal.edirepository.org/nis/metadataviewer?packageid=edi.5.2" target="_blank">https://portal.edirepository.o<wbr>rg/nis/metadataviewer?packagei<wbr>d=edi.5.2</a></div><div>Yes, the LTER dataset is in PASTA, but our code was not not sophisticated enough to get the id inserted into edi.5's /eml//dataSource node. But since both the LTER and BON data are time-series, we'll get that in on the next update.</div><div><br></div><div><br></div><div>Margaret</div><div><br></div><div class="gmail_extra"><br clear="all"><div><div class="m_-7709355773238912270m_8550953218675300062gmail-m_-6798144887516113654gmail-m_-7644125088135538883gmail-m_-1818316857653972572gmail_signature"><div dir="ltr"><font face="monospace, monospace"><span style="font-size:small">Margaret O'Brien</span><br><span style="font-size:small">ORCID: 0000-0002-1693-8322</span><br><span style="font-size:small">Information Management</span><br><span style="font-size:small">Marine Science Institute, UCSB</span><br><span style="font-size:small">Santa Barbara, CA 93106</span><br><span style="font-size:small"><a href="tel:(805)%20893-2071" value="+18058932071" target="_blank">805-893-2071</a> (voice)</span><br><a href="http://environmentaldatainitiative.org" target="_blank">http://environmentaldatainitia<wbr>tive.org</a><br><a href="http://sbc.marinebon.org" target="_blank">http://sbc.marinebon.org</a></font><div><font face="monospace, monospace"><a href="http://sbc.lternet.edu" target="_blank">http://sbc.lternet.edu</a></font></div><div><br><div><pre cols="72"><pre cols="72"><br></pre></pre></div></div></div></div></div>
<br><div class="gmail_quote">On Wed, Sep 20, 2017 at 8:11 AM, Jonathan Walsh <span dir="ltr"><<a href="mailto:walshjcaryinstitute@gmail.com" target="_blank">walshjcaryinstitute@gmail.com</a><wbr>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi IMs!<div><br></div><div>I have a question on how to best represent data that your study uses, but is provided by others.  If you use such data, we could use your insights on how you make that portion of your data available to the community and the LTER.</div><div><br></div><div>Baltimore Ecosystem Study gets its stream flow data from the USGS.  We in turn use this flow data to calculate our daily loads and other results that we track.  The USGS data are kept on their website and we incorporate them into our work.</div><div><br></div><div>For the purposes of making our data available to the larger community, (LTER, PASTA, DataONE, etc.)  we have historically just pointed to the USGS data on the USGS site.  (example:  <a href="https://waterdata.usgs.gov/usa/nwis/uv?01589197" target="_blank">https://waterdata.usgs.gov/us<wbr>a/nwis/uv?01589197</a> ) as opposed to collecting our own copy and providing it ourselves.</div><div><br></div><div>The above precludes us from providing a direct link to the data such as that that would be PASTA "type 1".</div><div><br></div><div>If you have any suggestions as to how, if differently, we should represent these data, which are integral to our work, but not provided by us, I would very much appreciate hearing them.</div><div><br></div><div>Thank you!</div><div><br></div><div>Jonathan</div><div><br></div><div>- </div><div><div class="m_-7709355773238912270m_8550953218675300062gmail-m_-6798144887516113654gmail-m_-7644125088135538883gmail-m_-1818316857653972572m_107527960199280287gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr">Jonathan Walsh</div><div dir="ltr"><a href="http://orcid.org/0000-0002-0658-0814" style="color:rgb(17,85,204);font-size:12.8px" target="_blank"><span><span style="font-size:11.5pt;font-family:Helvetica,sans-serif;background:rgb(255,238,148)"><span>orcid</span></span></span><span style="font-size:11.5pt;font-family:Helvetica,sans-serif">.org/0000-0002-0658-0814</span></a><br>Information Manager, Baltimore Ecosystem Study<br>
Cary Institute of Ecosystem Studies<br>
Box AB; Route 44A<br>
Millbrook, NY 12545-0129<br>
P: <a href="tel:845%2F677%2F7600%20Extension%20103" value="+18456777600" target="_blank">845/677/7600 Extension 103</a><br>
F: <a href="tel:845%2F677%2F5976" value="+18456775976" target="_blank">845/677/5976</a><br>
E: <a href="mailto:WalshJ@caryinstitute.org" target="_blank">WalshJ@caryinstitute.org</a></div></div></div></div></div></div></div></div></div></div></div></div>
</div></div>
<br>______________________________<wbr>_________________<br>
Long Term Ecological Research Network<br>
im mailing list<br>
<a href="mailto:im@lternet.edu" target="_blank">im@lternet.edu</a><br>
<br>
<br></blockquote></div><br></div></div>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr">Jonathan Walsh</div><div dir="ltr"><a href="http://orcid.org/0000-0002-0658-0814" style="color:rgb(17,85,204);font-size:12.8px" target="_blank"><span><span style="font-size:11.5pt;font-family:Helvetica,sans-serif;background:rgb(255,238,148)"><span>orcid</span></span></span><span style="font-size:11.5pt;font-family:Helvetica,sans-serif">.org/0000-0002-0658-0814</span></a><br>Information Manager, Baltimore Ecosystem Study<br>
Cary Institute of Ecosystem Studies<br>
Box AB; Route 44A<br>
Millbrook, NY 12545-0129<br>
P: <a href="tel:845%2F677%2F7600%20Extension%20103" value="+18456777600" target="_blank">845/677/7600 Extension 103</a><br>
F: <a href="tel:845%2F677%2F5976" value="+18456775976" target="_blank">845/677/5976</a><br>
E: <a href="mailto:WalshJ@caryinstitute.org" target="_blank">WalshJ@caryinstitute.org</a></div></div></div></div></div></div></div></div></div></div></div></div>
</div>