petsc/config/query_tests.py

6f5e9bd5SScott Kruger#!/usr/bin/env python
6f5e9bd5SScott Krugerimport fnmatch
6f5e9bd5SScott Krugerimport glob
6f5e9bd5SScott Krugerimport inspect
6f5e9bd5SScott Krugerimport os
6f5e9bd5SScott Krugerimport optparse
6f5e9bd5SScott Krugerimport pickle
6f5e9bd5SScott Krugerimport re
6f5e9bd5SScott Krugerimport sys
6f5e9bd5SScott Kruger
6f5e9bd5SScott Krugerthisfile = os.path.abspath(inspect.getfile(inspect.currentframe()))
6f5e9bd5SScott Krugerpdir = os.path.dirname(os.path.dirname(os.path.dirname(os.path.dirname(os.path.dirname(thisfile)))))
6f5e9bd5SScott Krugersys.path.insert(0, os.path.join(pdir, 'config'))
6f5e9bd5SScott Kruger
6f5e9bd5SScott Krugerimport testparse
6f5e9bd5SScott Krugerfrom gmakegentest import nameSpace
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger"""
6f5e9bd5SScott Kruger  Tool for querying the tests.
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger  Which tests to query?  Two options:
6f5e9bd5SScott Kruger      1. Query only the tests that are run for a given configuration.
6f5e9bd5SScott Kruger      2. Query all of the test files in the source directory
6f5e9bd5SScott Kruger  For #1:
6f5e9bd5SScott Kruger     Use dataDict as written out by gmakegentest.py in $PETSC_ARCH/$TESTBASE
6f5e9bd5SScott Kruger  For #2:
6f5e9bd5SScott Kruger     Walk the entire tree parsing the files as we go along using testparse.
6f5e9bd5SScott Kruger     The tree walker is simpler than what is in gmakegentest.py
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger  The dataDict follows that generated by testparse.  gmakegentest.py does
6f5e9bd5SScott Kruger  further manipulations of the dataDict to handle things like for loops
6f5e9bd5SScott Kruger  so if using #2, those modifications are not included.
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger  Querying:
6f5e9bd5SScott Kruger      The dataDict dictionary is then "inverted" to create a dictionary with the
6f5e9bd5SScott Kruger      range of field values as keys and list test names as the values.  This
6f5e9bd5SScott Kruger      allows fast searching
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger"""
6f5e9bd5SScott Kruger
*85bc9deeSScott Krugerdef isFile(maybeFile):
*85bc9deeSScott Kruger  ext=os.path.splitext(maybeFile)[1]
*85bc9deeSScott Kruger  if not ext: return False
*85bc9deeSScott Kruger  if ext not in ['.c','.cxx','.cpp','F90','F','cu']: return False
*85bc9deeSScott Kruger  return True
*85bc9deeSScott Kruger
*85bc9deeSScott Krugerdef pathToLabel(path):
*85bc9deeSScott Kruger  """
*85bc9deeSScott Kruger  Because the scripts have a non-unique naming, the pretty-printing
*85bc9deeSScott Kruger  needs to convey the srcdir and srcfile.  There are two ways of doing this.
*85bc9deeSScott Kruger  """
*85bc9deeSScott Kruger  # Strip off any top-level directories or spaces
*85bc9deeSScott Kruger  path=path.strip().replace(pdir,'')
*85bc9deeSScott Kruger  path=path.replace('src/','')
*85bc9deeSScott Kruger  if isFile(path):
*85bc9deeSScott Kruger    prefix=os.path.dirname(path).replace("/","_")
*85bc9deeSScott Kruger    suffix=os.path.splitext(os.path.basename(path))[0]
*85bc9deeSScott Kruger    label=prefix+"-"+suffix+'_*'
*85bc9deeSScott Kruger  else:
*85bc9deeSScott Kruger    path=path.rstrip('/')
*85bc9deeSScott Kruger    label=path.replace("/","_")+"-*"
*85bc9deeSScott Kruger  return label
*85bc9deeSScott Kruger
*85bc9deeSScott Krugerdef get_value(varset):
*85bc9deeSScott Kruger  """
*85bc9deeSScott Kruger  Searching args is a bit funky:
*85bc9deeSScott Kruger  Consider
*85bc9deeSScott Kruger      args:  -ksp_monitor_short -pc_type ml -ksp_max_it 3
*85bc9deeSScott Kruger  Search terms are:
*85bc9deeSScott Kruger    ksp_monitor, 'pc_type ml', ksp_max_it
*85bc9deeSScott Kruger  Also ignore all loops
*85bc9deeSScott Kruger    -pc_fieldsplit_diag_use_amat {{0 1}}
*85bc9deeSScott Kruger  Gives: pc_fieldsplit_diag_use_amat as the search term
*85bc9deeSScott Kruger  Also ignore -f ...  (use matrices from file) because I'll assume
*85bc9deeSScott Kruger   that this kind of information isn't needed for testing.  If it's
*85bc9deeSScott Kruger   a separate search than just grep it
*85bc9deeSScott Kruger  """
*85bc9deeSScott Kruger  if varset.startswith('-f '): return None
*85bc9deeSScott Kruger
*85bc9deeSScott Kruger  # First  remove loops
*85bc9deeSScott Kruger  value=re.sub('{{.*}}','',varset)
*85bc9deeSScott Kruger  # Next remove -
*85bc9deeSScott Kruger  value=varset.lstrip("-")
*85bc9deeSScott Kruger  # Get rid of numbers
*85bc9deeSScott Kruger  value=re.sub(r"[+-]? *(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)?",'',value)
*85bc9deeSScott Kruger  # return without spaces
*85bc9deeSScott Kruger  return value.strip()
*85bc9deeSScott Kruger
*85bc9deeSScott Krugerdef query(invDict,fields,labels):
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    Search the keys using fnmatch to find matching names and return list with
6f5e9bd5SScott Kruger    the results
6f5e9bd5SScott Kruger    """
*85bc9deeSScott Kruger    setlist=[]  # setlist is a list of lists that set opertions will operate on
*85bc9deeSScott Kruger    llist=labels.replace('|',',').split(',')
*85bc9deeSScott Kruger    i=-1
*85bc9deeSScott Kruger    for field in fields.replace('|',',').split(','):
*85bc9deeSScott Kruger        i+=1
*85bc9deeSScott Kruger        label=llist[i]
*85bc9deeSScott Kruger        if field == 'name':
*85bc9deeSScott Kruger            if '/' in label:
*85bc9deeSScott Kruger              label=pathToLabel(label)
*85bc9deeSScott Kruger            setlist.append(fnmatch.filter(invDict['name'],label))
*85bc9deeSScott Kruger            continue
5b6dee57SScott Kruger
*85bc9deeSScott Kruger        foundLabel=False   # easy to do if you misspell argument search
*85bc9deeSScott Kruger        for key in invDict[field]:
6f5e9bd5SScott Kruger            if fnmatch.filter([key],label):
*85bc9deeSScott Kruger              foundLabel=True
6f5e9bd5SScott Kruger              # Do not return values with not unless label itself has not
6f5e9bd5SScott Kruger              if label.startswith('!') and not key.startswith('!'): continue
6f5e9bd5SScott Kruger              if not label.startswith('!') and key.startswith('!'): continue
*85bc9deeSScott Kruger              setlist.append(invDict[field][key])
*85bc9deeSScott Kruger        if not foundLabel:
*85bc9deeSScott Kruger          setlist.append([])
6f5e9bd5SScott Kruger
*85bc9deeSScott Kruger    # Now process the union and intersection operators based on setlist
*85bc9deeSScott Kruger    allresults=[]
*85bc9deeSScott Kruger    # Union
*85bc9deeSScott Kruger    i=-1
*85bc9deeSScott Kruger    for ufield in fields.split(','):
*85bc9deeSScott Kruger       i+=1
*85bc9deeSScott Kruger       if '|' in ufield:
*85bc9deeSScott Kruger         # Intersection
*85bc9deeSScott Kruger         label=llist[i]
*85bc9deeSScott Kruger         results=set(setlist[i])
*85bc9deeSScott Kruger         for field in ufield.split('|')[1:]:
*85bc9deeSScott Kruger             i+=1
*85bc9deeSScott Kruger             label=llist[i]
*85bc9deeSScott Kruger             results=results.intersection(set(setlist[i]))
*85bc9deeSScott Kruger         allresults+=list(results)
*85bc9deeSScott Kruger       else:
*85bc9deeSScott Kruger         allresults+=setlist[i]
6f5e9bd5SScott Kruger
*85bc9deeSScott Kruger    # remove duplicate entries and sort to give consistent results
*85bc9deeSScott Kruger    uniqlist=list(set(allresults))
*85bc9deeSScott Kruger    uniqlist.sort()
*85bc9deeSScott Kruger    return  uniqlist
*85bc9deeSScott Kruger
*85bc9deeSScott Krugerdef get_inverse_dictionary(dataDict,fields,srcdir):
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    Create a dictionary with the values of field as the keys, and the name of
6f5e9bd5SScott Kruger    the tests as the results.
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    invDict={}
*85bc9deeSScott Kruger    # Comma-delimited lists denote union
*85bc9deeSScott Kruger    for field in fields.replace('|',',').split(','):
*85bc9deeSScott Kruger        if field not in invDict:
*85bc9deeSScott Kruger            if field == 'name':
*85bc9deeSScott Kruger                 invDict[field]=[]   # List for ease
*85bc9deeSScott Kruger            else:
*85bc9deeSScott Kruger                 invDict[field]={}
6f5e9bd5SScott Kruger        for root in dataDict:
6f5e9bd5SScott Kruger          for exfile in dataDict[root]:
6f5e9bd5SScott Kruger            for test in dataDict[root][exfile]:
aec279ffSScott Kruger              if test in testparse.buildkeys: continue
6f5e9bd5SScott Kruger              defroot = testparse.getDefaultOutputFileRoot(test)
*85bc9deeSScott Kruger              fname=nameSpace(defroot,os.path.relpath(root,srcdir))
5b6dee57SScott Kruger              if field == 'name':
*85bc9deeSScott Kruger                  invDict['name'].append(fname)
5b6dee57SScott Kruger                  continue
5b6dee57SScott Kruger              if field not in dataDict[root][exfile][test]: continue
6f5e9bd5SScott Kruger              values=dataDict[root][exfile][test][field]
6f5e9bd5SScott Kruger
*85bc9deeSScott Kruger              if not field == 'args' and not field == 'diff_args':
6f5e9bd5SScott Kruger                for val in values.split():
*85bc9deeSScott Kruger                    if val in invDict[field]:
*85bc9deeSScott Kruger                        invDict[field][val].append(fname)
6f5e9bd5SScott Kruger                    else:
*85bc9deeSScott Kruger                        invDict[field][val] = [fname]
*85bc9deeSScott Kruger              else:
*85bc9deeSScott Kruger                # Args are funky.
*85bc9deeSScott Kruger                for varset in re.split('(^|\W)-(?=[a-zA-Z])',values):
*85bc9deeSScott Kruger                  val=get_value(varset)
*85bc9deeSScott Kruger                  if not val: continue
*85bc9deeSScott Kruger                  if val in invDict[field]:
*85bc9deeSScott Kruger                    invDict[field][val].append(fname)
*85bc9deeSScott Kruger                  else:
*85bc9deeSScott Kruger                    invDict[field][val] = [fname]
*85bc9deeSScott Kruger        # remove duplicate entries (multiple test/file)
*85bc9deeSScott Kruger        if not field == 'name':
*85bc9deeSScott Kruger          for val in invDict[field]:
*85bc9deeSScott Kruger            invDict[field][val]=list(set(invDict[field][val]))
*85bc9deeSScott Kruger
6f5e9bd5SScott Kruger    return invDict
6f5e9bd5SScott Kruger
4e028dedSScott Krugerdef get_gmakegentest_data(testdir,petsc_dir,petsc_arch):
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger     Write out the dataDict into a pickle file
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    # This needs to be consistent with gmakegentest.py of course
4e028dedSScott Kruger    pkl_file=os.path.join(testdir,'datatest.pkl')
4e028dedSScott Kruger    # If it doesn't exist, then we need to regenerate
4e028dedSScott Kruger    if not os.path.exists(pkl_file):
4e028dedSScott Kruger      startdir=os.path.abspath(os.curdir)
4e028dedSScott Kruger      os.chdir(petsc_dir)
4e028dedSScott Kruger      args='--petsc-dir='+petsc_dir+' --petsc-arch='+petsc_arch+' --testdir='+testdir
4e028dedSScott Kruger      buf = os.popen('config/gmakegentest.py '+args).read()
4e028dedSScott Kruger      os.chdir(startdir)
4e028dedSScott Kruger
4e028dedSScott Kruger    fd = open(pkl_file, 'rb')
6f5e9bd5SScott Kruger    dataDict=pickle.load(fd)
6f5e9bd5SScott Kruger    fd.close()
6f5e9bd5SScott Kruger    return dataDict
6f5e9bd5SScott Kruger
6f5e9bd5SScott Krugerdef walktree(top):
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    Walk a directory tree, starting from 'top'
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    verbose = False
6f5e9bd5SScott Kruger    dataDict = {}
6f5e9bd5SScott Kruger    alldatafiles = []
6f5e9bd5SScott Kruger    for root, dirs, files in os.walk(top, topdown=False):
6f5e9bd5SScott Kruger        if root == 'output': continue
6f5e9bd5SScott Kruger        if '.dSYM' in root: continue
6f5e9bd5SScott Kruger        if verbose: print(root)
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger        dataDict[root] = {}
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger        for exfile in files:
6f5e9bd5SScott Kruger            # Ignore emacs files
6f5e9bd5SScott Kruger            if exfile.startswith("#") or exfile.startswith(".#"): continue
6f5e9bd5SScott Kruger            ext=os.path.splitext(exfile)[1]
6f5e9bd5SScott Kruger            if ext[1:] not in ['c','cxx','cpp','cu','F90','F']: continue
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger            # Convenience
6f5e9bd5SScott Kruger            fullex = os.path.join(root, exfile)
6f5e9bd5SScott Kruger            if verbose: print('   --> '+fullex)
6f5e9bd5SScott Kruger            dataDict[root].update(testparse.parseTestFile(fullex, 0))
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    return dataDict
6f5e9bd5SScott Kruger
*85bc9deeSScott Krugerdef do_query(use_source, startdir, srcdir, testdir, petsc_dir, petsc_arch,
*85bc9deeSScott Kruger             fields, labels, searchin):
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    Do the actual query
6f5e9bd5SScott Kruger    This part of the code is placed here instead of main()
6f5e9bd5SScott Kruger    to show how one could translate this into ipython/jupyer notebook
6f5e9bd5SScott Kruger    commands for more advanced queries
6f5e9bd5SScott Kruger    """
6f5e9bd5SScott Kruger    # Get dictionary
6f5e9bd5SScott Kruger    if use_source:
6f5e9bd5SScott Kruger        dataDict=walktree(startdir)
6f5e9bd5SScott Kruger    else:
4e028dedSScott Kruger        dataDict=get_gmakegentest_data(testdir, petsc_dir, petsc_arch)
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Get inverse dictionary for searching
*85bc9deeSScott Kruger    invDict=get_inverse_dictionary(dataDict, fields, srcdir)
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Now do query
*85bc9deeSScott Kruger    resList=query(invDict, fields, labels)
*85bc9deeSScott Kruger
*85bc9deeSScott Kruger    # Filter results using searchin
*85bc9deeSScott Kruger    newresList=[]
*85bc9deeSScott Kruger    if searchin.strip():
*85bc9deeSScott Kruger        for key in resList:
*85bc9deeSScott Kruger            if fnmatch.filter([key],searchin):
*85bc9deeSScott Kruger              newresList.append(key)
*85bc9deeSScott Kruger        resList=newresList
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Print in flat list suitable for use by gmakefile.test
6f5e9bd5SScott Kruger    print(' '.join(resList))
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    return
6f5e9bd5SScott Kruger
6f5e9bd5SScott Krugerdef main():
6f5e9bd5SScott Kruger    parser = optparse.OptionParser(usage="%prog [options] field match_pattern")
6f5e9bd5SScott Kruger    parser.add_option('-s', '--startdir', dest='startdir',
6f5e9bd5SScott Kruger                      help='Where to start the recursion if not srcdir',
6f5e9bd5SScott Kruger                      default='')
aec279ffSScott Kruger    parser.add_option('-p', '--petsc-dir', dest='petsc_dir',
aec279ffSScott Kruger                      help='Set PETSC_DIR different from environment',
6f5e9bd5SScott Kruger                      default=os.environ.get('PETSC_DIR'))
6f5e9bd5SScott Kruger    parser.add_option('-a', '--petsc-arch', dest='petsc_arch',
6f5e9bd5SScott Kruger                      help='Set PETSC_ARCH different from environment',
6f5e9bd5SScott Kruger                      default=os.environ.get('PETSC_ARCH'))
6f5e9bd5SScott Kruger    parser.add_option('--srcdir', dest='srcdir',
6f5e9bd5SScott Kruger                      help='Set location of sources different from PETSC_DIR/src.  Must be full path.',
6f5e9bd5SScott Kruger                      default='src')
6f5e9bd5SScott Kruger    parser.add_option('-t', '--testdir', dest='testdir',
6f5e9bd5SScott Kruger                      help='Test directory if not PETSC_ARCH/tests.  Must be full path',
6f5e9bd5SScott Kruger                      default='tests')
6f5e9bd5SScott Kruger    parser.add_option('-u', '--use-source', action="store_false",
6f5e9bd5SScott Kruger                      dest='use_source',
6f5e9bd5SScott Kruger                      help='Query all sources rather than those configured in PETSC_ARCH')
*85bc9deeSScott Kruger    parser.add_option('-i', '--searchin', dest='searchin',
*85bc9deeSScott Kruger                      help='Filter results from the arguments',
*85bc9deeSScott Kruger                      default='')
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    opts, args = parser.parse_args()
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Argument Sanity checks
6f5e9bd5SScott Kruger    if len(args) != 2:
6f5e9bd5SScott Kruger        parser.print_usage()
6f5e9bd5SScott Kruger        print('Arguments: ')
6f5e9bd5SScott Kruger        print('  field:          Field to search for; e.g., requires')
5b6dee57SScott Kruger        print('                  To just match names, use "name"')
6f5e9bd5SScott Kruger        print('  match_pattern:  Matching pattern for field; e.g., cuda')
6f5e9bd5SScott Kruger        return
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Process arguments and options -- mostly just paths here
6f5e9bd5SScott Kruger    field=args[0]
6f5e9bd5SScott Kruger    match=args[1]
*85bc9deeSScott Kruger    searchin=opts.searchin
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    petsc_dir = opts.petsc_dir
6f5e9bd5SScott Kruger    petsc_arch = opts.petsc_arch
6f5e9bd5SScott Kruger    petsc_full_arch = os.path.join(petsc_dir, petsc_arch)
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    if opts.srcdir == 'src':
6f5e9bd5SScott Kruger      petsc_full_src = os.path.join(petsc_dir, 'src')
6f5e9bd5SScott Kruger    else:
6f5e9bd5SScott Kruger      petsc_full_src = opts.srcdir
6f5e9bd5SScott Kruger    if opts.testdir == 'tests':
6f5e9bd5SScott Kruger      petsc_full_test = os.path.join(petsc_full_arch, 'tests')
6f5e9bd5SScott Kruger    else:
6f5e9bd5SScott Kruger      petsc_full_test = opts.testdir
6f5e9bd5SScott Kruger    if opts.startdir:
6f5e9bd5SScott Kruger      startdir=opts.startdir=petsc_full_src
6f5e9bd5SScott Kruger    else:
6f5e9bd5SScott Kruger      startdir=petsc_full_src
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Options Sanity checks
6f5e9bd5SScott Kruger    if not os.path.isdir(petsc_dir):
6f5e9bd5SScott Kruger        print("PETSC_DIR must be a directory")
6f5e9bd5SScott Kruger        return
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    if not opts.use_source:
6f5e9bd5SScott Kruger        if not os.path.isdir(petsc_full_arch):
6f5e9bd5SScott Kruger            print("PETSC_DIR/PETSC_ARCH must be a directory")
6f5e9bd5SScott Kruger            return
6f5e9bd5SScott Kruger        elif not os.path.isdir(petsc_full_test):
6f5e9bd5SScott Kruger            print("Testdir must be a directory"+petsc_full_test)
6f5e9bd5SScott Kruger            return
6f5e9bd5SScott Kruger    else:
6f5e9bd5SScott Kruger        if not os.path.isdir(petsc_full_src):
6f5e9bd5SScott Kruger            print("Source directory must be a directory"+petsc_full_src)
6f5e9bd5SScott Kruger            return
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    # Do the actual query
4e028dedSScott Kruger    do_query(opts.use_source, startdir, petsc_full_src, petsc_full_test,
*85bc9deeSScott Kruger             petsc_dir, petsc_arch, field, match, searchin)
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger    return
6f5e9bd5SScott Kruger
6f5e9bd5SScott Kruger
6f5e9bd5SScott Krugerif __name__ == "__main__":
6f5e9bd5SScott Kruger        main()