<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>AlgoOne Datenqualitätssicherung on Bernd Plumhoff</title>
    <link>https://www.berndplumhoff.de/tags/algoone-datenqualit%C3%A4tssicherung/</link>
    <description>Recent content in AlgoOne Datenqualitätssicherung on Bernd Plumhoff</description>
    <generator>Hugo</generator>
    <language>en</language>
    <lastBuildDate>Sun, 10 May 2026 15:44:00 +0100</lastBuildDate>
    <atom:link href="https://www.berndplumhoff.de/tags/algoone-datenqualit%C3%A4tssicherung/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>sbDataStats (VBA)</title>
      <link>https://www.berndplumhoff.de/sbdatastats_de/</link>
      <pubDate>Sun, 10 May 2026 15:44:00 +0100</pubDate>
      <guid>https://www.berndplumhoff.de/sbdatastats_de/</guid>
      <description>&lt;p&gt;&lt;strong&gt;&amp;ldquo;Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.&amp;rdquo; [Aaron Levenstein]&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;abstract&#34;&gt;Abstract&lt;/h2&gt;&#xA;&lt;p&gt;Selbstverständlich kann man für jede Eingabe ein spezielles Datenprüfprogramm erzeugen.&lt;/p&gt;&#xA;&lt;p&gt;Aber was wenn Sie beliebige Daten (in einer CSV Datei) durch eine allgemeine&#xA;Datenanalyse untersuchen lassen wollten?&lt;/p&gt;&#xA;&lt;p&gt;Für eine allgemeine numerische Analyse könnten Sie einfach Minimum, Durchschnitt und&#xA;Maximum ermitteln und z. B. bezüglich Extremwerten warnen, die um mehr als 2.5&#xA;Standardabweichungen vom Durchschnitt abweichen.&#xA;Bei Textdaten könnte ein Analyseprogramm die Häufigkeit von Worten und Zeichen ausgeben.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Vergleiche Korrelationsmatrizen (Perl)</title>
      <link>https://www.berndplumhoff.de/vergleiche_korrelationsmatrizen_de/</link>
      <pubDate>Sun, 10 May 2026 15:44:00 +0100</pubDate>
      <guid>https://www.berndplumhoff.de/vergleiche_korrelationsmatrizen_de/</guid>
      <description>&lt;p&gt;&lt;strong&gt;&amp;ldquo;Remember, my friend, that knowledge is stronger than memory, and we should not trust the weaker.&amp;rdquo; [Bram Stoker]&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;abstract&#34;&gt;Abstract&lt;/h2&gt;&#xA;&lt;p&gt;Vor einigen Jahren entwickelte ich ein Perl Programm für einen AlgoOne Kunden.&#xA;Im Laufe der Zeit erweiterte ich das Programm und ließ es die &lt;em&gt;RMLinks.cfg&lt;/em&gt; Datei einlesen,&#xA;so dass neue Risikofaktoren automatisch einbezogen wurden.&lt;/p&gt;&#xA;&lt;h2 id=&#34;implementierungsansatz&#34;&gt;Implementierungsansatz&lt;/h2&gt;&#xA;&lt;p&gt;Mein Implementierungsansatz war:&lt;/p&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;1. Erste Matrix einlesen&#xA;    Prüfungen:&#xA;    Matrix quadratisch?&#xA;    Risikofaktorsortierung links-&amp;gt;rechts (in der obersten Zeile) == oben-&amp;gt;unten (in der linkesten Spalte)?&#xA;    Diagonalen == 1 (Warnung)?&#xA;    Keine NC Kategorie (Warnung falls doch)?&#xA;    Matrix symmetrisch: M(i,j) == M(j,i) für alle i,j?&#xA;    [Nicht bei DC Dateien weil dort nicht gegeben.]&#xA;&#xA;2. Zweite Matrix einlesen&#xA;    Prüfungen wie oben&#xA;&#xA;3. Risikofaktoren in beiden Matrizen identisch?&#xA;    Warnung bei Risikofactoren die in der ersten aber nicht in der zweiten Matrix sind und umgekehrt&#xA;    Zeige die Ausreißer pro Kategorie&#xA;    Zeige die Ausreißer pro Währung&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;h2 id=&#34;parameter&#34;&gt;Parameter&lt;/h2&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;b - breaches: do not report differences between the two input matrices but breaches beyond tolerances.&#xA;d - debug [level] gives debugging information at detail level level&#xA;    level 1: -&#xA;    level 2: -&#xA;    level 3: Print all elements of matrices 1 and 2&#xA;f - read deviation file [-f needs to be followed by a valid filename]&#xA;    Reads min and max values for all slices for differences which should&#xA;    be ignored during comparison. See option -w to get format example&#xA;h - help: list parameters and their explanation&#xA;i -  ignore risk factors in a given file [-i needs to be followed by a valid filename]&#xA;m - set max rank index [default is 6 (=return highest 3&#xA;    and lowest 3 of each slice); m needs to be even and &amp;gt;= 4 !&#xA;n - tolerate risk factor category NC&#xA;r - set Algo risk factor category file [default is ./RMLinks.cfg&#xA;s - summarize findings, no detailed warnings or error messages&#xA;t - read file with tolerated changes for each matrix element and apply tolerance check&#xA;v - print version&#xA;w - write deviation file with min and max values of all slices.&#xA;    This file is comma-separated to be easily readable via Excel.&#xA;    It can be amended and used with option -f later&#xA;    [-w needs to be followed by a valid filename, preferrably ending with .csv&#xA;x - read translation table [-x needs to be followed by a valid filename].&#xA;    Risk factor names of matrix 1 will be translated by second name in comma-separated row&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;h2 id=&#34;beispiel-für-einen-programmaufruf&#34;&gt;Beispiel für einen Programmaufruf&lt;/h2&gt;&#xA;&lt;p&gt;Ein typischer Aufruf dieses Programms von einem Shell Script aus könnte so aussehen:&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
